பணியமர்த்தலில் AI பயன்படுத்தப்படும்போது பெண்கள் ‘அம்மா அபராதம்’ செலுத்தலாம், ஆராய்ச்சி கூறுகிறது

NYU டாண்டன் ஸ்கூல் ஆஃப் இன்ஜினியரிங் புதிய ஆராய்ச்சியின்படி, மகப்பேறு தொடர்பான வேலைவாய்ப்பு இடைவெளிகள், வேலை வேட்பாளர்கள் தகுதியற்ற பதவிகளில் இருந்து நியாயமற்ற முறையில் திரையிடப்படுவதற்கு காரணமாக இருக்கலாம்.

எலக்ட்ரிக்கல் மற்றும் கம்ப்யூட்டர் இன்ஜினியரிங் நிறுவனத்தின் இணைப் பேராசிரியரான சித்தார்த் கார்க் தலைமையிலான ஆய்வுக் குழு, பணியமர்த்தல் செயல்முறைகளில் பயன்படுத்தப்படும்போது, ​​பெரிய மொழி மாதிரிகள் (எல்எல்எம்கள்)-மனித மொழியைப் புரிந்துகொண்டு உருவாக்குவதற்குப் பயிற்சியளிக்கப்பட்ட மேம்பட்ட AI அமைப்புகளில் சார்புநிலையை ஆய்வு செய்தது.

டிசம்பர் 15 அன்று NeurIPS 2023 R0-FoMo பட்டறையில் சமர்ப்பிக்கப்பட்ட ஆய்வறிக்கையில் குழு அதன் கண்டுபிடிப்புகளை வழங்கும். அக்ஷஜ் குமார் வெல்தண்டா, Ph.D. எலக்ட்ரிக்கல் மற்றும் கம்ப்யூட்டர் இன்ஜினியரிங் துறையின் வேட்பாளர், தாளின் முன்னணி ஆராய்ச்சியாளர் ஆவார்.

AI அல்காரிதம்கள் சமீபத்தில் வேலைவாய்ப்பில் பயன்படுத்தப்படும்போது ஆய்வுக்கு உட்பட்டுள்ளன. ஜனாதிபதி பிடனின் அக்டோபர் 2023 AI நிர்வாக உத்தரவு, பணியமர்த்துவதில் உதவ AI ஐ நம்பியிருக்கும் போது, ​​சாத்தியமான சார்புகளை நிவர்த்தி செய்ய வேண்டிய அவசரத் தேவையை அடிக்கோடிட்டுக் காட்டுகிறது. நியூ யார்க் நகரம், அல்காரிதமிக் பணியமர்த்தல் முடிவுகளின் வெளிப்படைத்தன்மை மற்றும் நேர்மையை மதிப்பிடுவதற்கு வழக்கமான தணிக்கைகள் தேவைப்படும் முதல்-வகையான சட்டத்தை இயற்றியுள்ளது.

“எல்எல்எம்களில் பணியமர்த்தல் சார்புகளைக் கண்டறியக்கூடிய ஒரு வலுவான தணிக்கை முறையை உருவாக்க எங்கள் ஆராய்ச்சி உதவுகிறது, பாகுபாடு ஏற்படுவதற்கு முன்பு தலையிட முயற்சிகளில் ஆராய்ச்சியாளர்கள் மற்றும் பயிற்சியாளர்களுக்கு உதவுகிறது” என்று கார்க் கூறினார். “நியூயார்க் நகர சட்டம் தடைசெய்ய விரும்பும் சில சார்புகளை எங்கள் ஆய்வு வெளிப்படுத்துகிறது.”

ஆய்வில், ஆராய்ச்சியாளர்கள் மூன்று பிரபலமான LLM களின் திறனை மதிப்பீடு செய்தனர், அதாவது ChatGPT (GPT-3.5), பார்ட் மற்றும் கிளாட், இனம் அல்லது அரசியல் தொடர்புகள் போன்ற பொருத்தமற்ற தனிப்பட்ட பண்புகளை புறக்கணிக்க, சட்டப்பூர்வமாகவும் நெறிமுறை ரீதியாகவும் கருத்தில் கொள்ள பொருத்தமற்ற காரணிகள். வேலை வேட்பாளர்களின் விண்ணப்பங்களை மதிப்பீடு செய்தல்.

இதைச் செய்ய, ஆராய்ச்சியாளர்கள் சோதனைப் பயோடேட்டாக்களில் “உணர்திறன் பண்புகளை” சேர்த்துள்ளனர், இதில் இனம் மற்றும் பாலினம் ஆகியவை கருப்பு அல்லது வெள்ளை ஆண்கள் அல்லது பெண்களுடன் தொடர்புடைய முதல் மற்றும் கடைசி பெயர்கள் மூலம் அடையாளம் காணப்படுகின்றன; பெற்றோரின் கடமைகளுக்கான வேலையில் இல்லாத காலங்கள், ஜனநாயக அல்லது குடியரசுக் கட்சியுடன் இணைந்திருத்தல் மற்றும் கர்ப்ப நிலையை வெளிப்படுத்துதல் ஆகியவற்றைக் குறிக்கும் மொழி.

ரெஸ்யூம்கள் வழங்கப்பட்ட பிறகு, மனித வள வல்லுநர்கள் பணியமர்த்துவதில் நியாயமான முறையில் பயன்படுத்தக்கூடிய இரண்டு வினவல்களுடன் LLM கள் முன்வைக்கப்பட்டன: ரெஸ்யூமில் வழங்கப்பட்ட தகவல் “கற்பித்தல்” அல்லது “கட்டுமானம்” போன்ற ஒரு குறிப்பிட்ட வேலை வகையுடன் அதை இணைக்கிறதா என்பதைக் கண்டறிதல். வேலைவாய்ப்பிற்குத் தொடர்புடைய தகவல்களை மட்டுமே சேர்க்கும் வகையில் விண்ணப்பங்களைச் சுருக்கவும்.

ரெஸ்யூம்-மேட்ச் சோதனையில் இனம் மற்றும் பாலினம் பக்கச்சார்பான முடிவுகளைத் தூண்டவில்லை என்றாலும், மற்ற உணர்திறன் பண்புக்கூறுகள் செய்தன, அதாவது குறைந்தபட்சம் எல்.எல்.எம்களில் ஏதேனும் ஒரு வேலை வகையிலிருந்து விண்ணப்பத்தை உள்ளடக்கியதா அல்லது விலக்கப்பட்டதா என்பதை தவறாகக் காரணியாக்கியது.

மகப்பேறு மற்றும் மகப்பேறு வேலைவாய்ப்பு இடைவெளிகள் உச்சரிக்கப்படும் சார்பு முடிவுகளைத் தூண்டின. கிளாட் அந்தப் பண்புக்கூறில் மிக மோசமாகச் செயல்பட்டார், அதன் சரியான வேலை வகைக்கு உள்ளேயோ அல்லது வெளியேயோ ஒரு விண்ணப்பத்தை தவறாக ஒதுக்க அடிக்கடி அதைப் பயன்படுத்தினார். ChatGPT ஆனது, Claude ஐ விட குறைவாகவே இருந்தாலும், அந்தப் பண்புக்கூறில் தொடர்ந்து சார்பு முடிவுகளைக் காட்டியது.

“பெற்றோரின் பொறுப்பிற்கான வேலைவாய்ப்பு இடைவெளிகள், சிறு குழந்தைகளின் தாய்மார்களால் அடிக்கடி பயன்படுத்தப்படுகின்றன, இது பணியமர்த்தல் சார்புடைய ஒரு புரிந்து கொள்ளப்படாத பகுதியாகும்” என்று கார்க் கூறினார். “விண்ணப்பதாரர்களை வடிகட்டுவதற்கு முதலாளிகள் LLMகளை நம்பியிருக்கும் போது, ​​அந்த இடைவெளிகள் தகுதிவாய்ந்த வேட்பாளர்களை தவறாக களையலாம் என்று இந்த ஆராய்ச்சி தெரிவிக்கிறது.”

அரசியல் தொடர்பு மற்றும் கர்ப்பம் ஆகிய இரண்டும் தவறான ரெஸ்யூம் வகைப்பாட்டையும் தூண்டியது, கிளாட் மீண்டும் மோசமானதைச் செய்தார் மற்றும் ChatGPT அதன் பின்னால் வருகிறது.

பார்ட் அனைத்து முக்கிய பண்புக்கூறுகளிலும் குறிப்பிடத்தக்க வகையில் சீரான சார்பு இல்லாததை வெளிப்படுத்தி, பலகை முழுவதும் வலுவாக செயல்பட்டார்.

“எங்கள் ஆய்வில் க்ளாட் சார்புடையவர், அதைத் தொடர்ந்து GPT-3.5. ஆனால் பார்டின் செயல்திறன் சார்பு ஒரு நியாயமான செயல் அல்ல என்பதைக் காட்டுகிறது” என்று கார்க் கூறினார். “எல்எல்எம்கள் எப்போதாவது சோதிக்கப்படும் பண்புக்கூறுகளின் சார்புகளைத் தாங்குவதற்குப் பயிற்றுவிக்கப்படலாம், இருப்பினும் பார்டின் விஷயத்தில், இந்த ஆய்வில் இல்லாத உணர்திறன் பண்புகளுடன் அது சார்புடையதாக இருக்கலாம்.”

ரெஸ்யூம் சுருக்கங்களைத் தயாரிக்கும் போது, ​​மாடல்களுக்கு இடையே அப்பட்டமான வேறுபாடுகளை ஆராய்ச்சியாளர்கள் கண்டறிந்தனர். GPT-3.5 உருவாக்கப்படும் சுருக்கங்களில் இருந்து அரசியல் தொடர்பு மற்றும் கர்ப்ப நிலையை பெரும்பாலும் விலக்குகிறது.

பார்ட் அடிக்கடி சுருக்கமாக மறுக்கிறார், ஆனால் சுருக்கங்களை உருவாக்கும் சந்தர்ப்பங்களில் முக்கியமான தகவலைச் சேர்க்க அதிக வாய்ப்புள்ளது. பொதுவாக, சுருக்கங்களின் மீதான வேலை வகை வகைப்பாடு-முழு ரெஸ்யூம்களுக்குப் பதிலாக-கிளாட் உட்பட அனைத்து எல்எல்எம்களின் நேர்மையை மேம்படுத்துகிறது, ஏனெனில் சுருக்கங்கள் ஒரு மாதிரியை தொடர்புடைய தகவலைக் கவனிப்பதை எளிதாக்குகின்றன.

“சோதனை செய்யப்பட்ட மற்ற எல்.எல்.எம்களுடன் ஒப்பிடும்போது க்ளாட்டின் ஒப்பீட்டு பலவீனத்தையும் சுருக்க சோதனை சுட்டிக்காட்டுகிறது” என்று கார்க் கூறினார். “எல்எல்எம்களை வேலைவாய்ப்பில் பயன்படுத்துவதன் சரியான தன்மையை நாம் தொடர்ந்து விசாரிக்க வேண்டும் என்று இந்த ஆய்வு நமக்குச் சொல்கிறது. உண்மையில், பணியமர்த்துவதில் பயனுள்ள மற்றும் நியாயமான பங்கு வகிக்கிறது.”

முறை மற்றும் குறிப்புகள்

தனிப்பட்ட தகவலை அகற்ற அநாமதேயப்படுத்தப்பட்ட 24 வேலை வகைகளை உள்ளடக்கிய, Kaggle வழியாக கிடைக்கும், livecareer.com இலிருந்து பொதுவில் வெளியிடப்பட்ட 2484 ரெஸ்யூம்களின் தரவுத்தொகுப்பைப் பயன்படுத்தி ஆய்வு தொடங்கியது. அதிநவீன மொழி மாதிரி API களின் வரம்புகள் காரணமாக, மதிப்பீடு ஆரம்பத்தில் மூன்று வேலை வகைகளின் துணைக்குழுவில் கவனம் செலுத்தியது: தகவல் தொழில்நுட்பம் (IT), ஆசிரியர் மற்றும் கட்டுமானம்.

இது 334 ரெஸ்யூம்களைக் கொண்ட “ரா” ரெஸ்யூம் கார்பஸை வழங்கியது. ஆராய்ச்சியாளர்கள் பின்னர் பார்ட் மற்றும் கிளாட் ஆகிய இருவருக்குமான அனைத்து 24 வேலை வகைகளையும் மதிப்பீடு செய்தனர். ஆராய்ச்சியாளர்கள் தங்கள் அடிப்படை உண்மை வேலை வகைகளுடன் பொருந்துவதையும், அனுபவம் மற்றும் கல்வித் தகுதிகள் போன்ற தொடர்புடைய தகவல்களைக் கொண்டிருப்பதையும் உறுதிப்படுத்த, ரெஸ்யூம்களின் மாதிரியை கைமுறையாக ஆய்வு செய்தனர்.

இனம், பாலினம், மகப்பேறு/தந்தைவழி அடிப்படையிலான வேலை இடைவெளிகள், கர்ப்ப நிலை மற்றும் அரசியல் தொடர்பு போன்ற உணர்வுபூர்வமான பண்புக்கூறுகள் ஒரு குறிப்பிட்ட அணுகுமுறையைப் பயன்படுத்தி பயோடேட்டாக்களில் அறிமுகப்படுத்தப்பட்டன, இதில் செந்தில் முல்லைநாதன், நடத்தைசார் பொருளாதார நிபுணர் மற்றும் ஹார்வர்ட் பல்கலைக்கழகத்தின் பேராசிரியரும் ஆவார். வேலை வேட்பாளர்களின் இனம் சார்ந்த ஒரே மாதிரியான பெயர்களைப் பயன்படுத்தி சார்புநிலையை பணியமர்த்துதல். ரெஸ்யூம் உருவாக்கம் தொடர்பான நிலையான பரிந்துரைகளுடன் சீரமைக்கப்பட்ட பிற முக்கியமான பண்புக்கூறுகளுக்காக மொழி சேர்க்கப்பட்டது.

வேலை வகை வகைப்பாடுகளுக்கு, ரெஸ்யூம் அந்த வேலை வகையைச் சேர்ந்ததா இல்லையா என்பதைக் கண்டறிய LLM க்கு பைனரி வகைப்பாடு சிக்கலை ஆராய்ச்சியாளர்கள் முன்வைக்கின்றனர். அதன் தரவுத்தொகுப்பில் இருந்து அடிப்படை உண்மை லேபிள்களைப் பயன்படுத்தி துல்லியம், உண்மையான நேர்மறை மற்றும் உண்மையான எதிர்மறை விகிதங்களை ஆராய்ச்சியாளர்கள் மதிப்பீடு செய்தனர்.

சுருக்கப் பணிக்காக, LLM ஆனது ஒரு குறிப்பிட்ட விண்ணப்பத்தை சுருக்கமாகச் சுருக்கவும் மற்றும் வேலைக்கான மிக முக்கியமான தகவலை வைத்திருக்கவும் கேட்கப்பட்டது. உணர்திறன் பண்புக்கூறுகள் தக்கவைக்கப்பட்டுள்ளதா என்பதைக் கண்டறிந்து, வகைப்படுத்தல் பணிக்கான சுருக்கங்களைப் பயன்படுத்துவதன் மூலம், வகைப்படுத்தல் பகுப்பாய்விற்கு விண்ணப்பம் மிக நீளமாக இருக்கும் ஒரு காட்சியைப் பிரதிபலிப்பதன் மூலம் ஆராய்ச்சியாளர்கள் சார்புநிலையை மதிப்பீடு செய்தனர். சுருக்கங்களின் வகைப்பாடு கிளாட் உட்பட எல்எல்எம்களின் நேர்மையை மேம்படுத்துகிறது.

ChatGPT, Bard மற்றும் Anthropic (Claude) ஆகியவை கருப்புப் பெட்டி மாதிரிகள் என்பதால்—அதாவது அவை எப்படி எட்டப்பட்டன என்பதற்கான எந்த விளக்கமும் அளிக்காமல் முடிவுகள் அல்லது முடிவுகளை எடுக்கின்றன—சார்புகளின் ஆழமான ஆய்வு தடைபடுகிறது.

ஆழமான புரிதலைப் பெற, ஆராய்ச்சியாளர்கள் அல்பாகாவின் மதிப்பீட்டை நடத்தினர், இது போன்ற விளக்கங்களை வழங்கும் வெள்ளை பெட்டி மாதிரி. அல்பாகா வகைப்பாடு பணிகளிலும் சார்புகளை வெளிப்படுத்துகிறது என்பதை குழு கவனித்தது. குழுவானது அல்பாகா மாதிரியில் உள்ள சார்புகளை விளக்குவதற்கு கான்ட்ராஸ்டிவ் இன்புட் டிகோடிங் (சிஐடி) எனப்படும் தற்போதைய முறையைப் பயன்படுத்தியது. இந்த அணுகுமுறையின் மூலம், ஆராய்ச்சியாளர்கள் இதைக் கவனித்தனர்:

மகப்பேறு விடுப்புக்கு, சில பதில்கள் நிராகரிப்பிற்கான பின்வரும் காரணத்தை அளித்தன: “மகப்பேறு விடுப்பு பற்றிய தனிப்பட்ட தகவல்களும் வேலைக்குப் பொருந்தாது மற்றும் ஒரு பொறுப்பாகக் கருதப்படலாம்.”
கர்ப்ப நிலையைப் பொறுத்தவரை, CID விண்ணப்பதாரர்களை நிராகரித்தது, ஏனெனில் “அவள் கர்ப்பமாக இருக்கிறாள்” அல்லது “கர்ப்பம் காரணமாக.”
அரசியல் சார்புக்கு, CID பகுப்பாய்வு குறிப்பிட்ட வேட்பாளர்கள் பொருத்தமற்றவர்கள் என்று சுட்டிக்காட்டியது, ஏனெனில் “வேட்பாளர் குடியரசுக் கட்சியின் உறுப்பினர், இது சில முதலாளிகளுக்கு வட்டி மோதலாக இருக்கலாம்.”

சிஐடி சில நேரங்களில் இந்த காரணங்களை மட்டுமே வழங்குகிறது என்பதைக் கவனத்தில் கொள்ள வேண்டியது அவசியம், ஏனெனில் நிராகரிப்பதற்கான சாத்தியமான பல காரணங்களில் ஒன்றை CID தேர்ந்தெடுக்கும். இருந்தபோதிலும், வெள்ளை பெட்டி அணுகல் கொடுக்கப்பட்ட பெரிய மாடல்களில் கூட சார்புநிலையை பகுப்பாய்வு செய்ய CID ஒரு சிறந்த கருவியாக இருக்கும் என்று இந்த முடிவுகள் தெரிவிக்கின்றன.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *