புதிய ஆராய்ச்சி முயற்சியானது தென்கிழக்கு ஆசியாவிற்கான பெரிய மொழி AI மாதிரியை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளது

தென்கிழக்கு ஆசிய நாடுகளின் மக்கள்தொகையை சிறப்பாக சந்திக்கும் ஒரு பெரிய மொழி மாதிரியை (LLM) உருவாக்க ஒரு புதிய ஆராய்ச்சி முயற்சி நடந்து வருகிறது.

நேஷனல் மல்டிமோடல் எல்எல்எம் திட்டம் எனப் பெயரிடப்பட்ட இந்த முயற்சியானது, பிராந்தியத்தின் மாறுபட்ட கலாச்சாரம் மற்றும் மொழியின் கலவையை ஆதரிக்கும் ஒரு செயற்கை நுண்ணறிவு (AI) பெரிய மொழி மாதிரியை உருவாக்கும் முயற்சியில் சிங்கப்பூர் தலைமையில் உள்ளது.

மூன்று அரசு முகமைகள் — Infocomm Media Development Authority (IMDA), AI Singapore (AISG), மற்றும் அறிவியல், தொழில்நுட்பம் மற்றும் ஆராய்ச்சிக்கான நிறுவனம் (A*STAR) — SG$70 மில்லியன் (SG$) மதிப்புடைய நிதியுடன், ஆராய்ச்சித் திட்டத்தைத் தொடங்க ஒத்துழைத்துள்ளன. தேசிய ஆராய்ச்சி அறக்கட்டளையிலிருந்து $52.48 மில்லியன்).

“தொழில்நுட்பம் வேகமாக வளர்ச்சியடைந்து வருவதால், எல்எல்எம்களில் இறையாண்மை திறன்களை மேம்படுத்துவதற்கான ஒரு மூலோபாய தேவை உள்ளது,” என்று ஏஜென்சிகள் ஒரு கூட்டு அறிக்கையில் தெரிவித்துள்ளன. “சிங்கப்பூர் மற்றும் பிராந்தியத்தின் உள்ளூர் மற்றும் பிராந்திய கலாச்சாரங்கள், மதிப்புகள் மற்றும் விதிமுறைகள் மேற்கத்திய நாடுகளில் இருந்து வேறுபடுகின்றன, அங்கு பெரும்பாலான பெரிய மொழி மாதிரிகள் உருவாகின்றன.”

சிங்கப்பூர் உட்பட தென்கிழக்கு ஆசியாவிற்கான மல்டிமாடல் மற்றும் உள்ளூர்மயமாக்கப்பட்ட எல்எல்எம்களை உருவாக்குவதன் முக்கியத்துவத்தை அவர்கள் அடிக்கோடிட்டுக் காட்டியுள்ளனர், இது பிராந்தியத்தின் பல்வேறு கலாச்சாரங்கள் மற்றும் மொழிகளுடன் தொடர்புடைய சூழல் மற்றும் மதிப்புகளைப் புரிந்துகொள்கிறது. இந்த மாறுபாடுகள் சிங்கப்பூரின் பன்மொழி மக்கள்தொகையில் மொழிகளுக்கு இடையேயான சூழல் மாறுதலை உள்ளடக்கும்.

இந்த ஆராய்ச்சி முயற்சியானது சிங்கப்பூரின் தேசிய சூப்பர் கம்ப்யூட்டிங் மையத்தின் உயர்-செயல்திறன் கொண்ட கணினி வளங்களைத் தட்டி, நாட்டின் ஆராய்ச்சி மற்றும் பொறியியல் திறன்களை மல்டிமாடல் எல்எல்எம்களில் மேம்படுத்தும்.

“இந்த தேசிய முயற்சியானது உலகளாவிய AI மையமாக மாறுவதற்கான சிங்கப்பூரின் உறுதிப்பாட்டை அடிக்கோடிட்டுக் காட்டுகிறது” என்று பிஸ்டெக் குழுமத்தின் IMDA இன் உதவி தலைமை நிர்வாகி ஓங் சென் ஹுய் கூறினார். “மொழியானது ஒத்துழைப்பிற்கு இன்றியமையாததாக உள்ளது. திறமையில் முதலீடு செய்வதன் மூலமும், பிராந்திய மொழிகளுக்கான பெரிய மொழி AI மாதிரிகளில் முதலீடு செய்வதன் மூலமும், எல்லைகள் தாண்டி தொழில்துறை ஒத்துழைப்பை வளர்த்து, தென்கிழக்கு ஆசியாவில் AI கண்டுபிடிப்புகளின் அடுத்த அலையை இயக்க விரும்புகிறோம்.”

இந்த முயற்சியானது AISG இன் தென்கிழக்கு ஆசிய மொழிகள் ஒரு நெட்வொர்க்கில் (SEA-LION) தற்போதைய முயற்சிகளை உருவாக்கும், இது ஒரு திறந்த மூல LLM ஆகும், இது இன்று சந்தையில் உள்ள LLMகளுடன் ஒப்பிடும்போது சிறியதாகவும், நெகிழ்வானதாகவும், வேகமாகவும் வடிவமைக்கப்பட்டுள்ளது என்று அரசு நிறுவனம் கூறியுள்ளது. . SEA-LION தற்போது இரண்டு அடிப்படை மாதிரிகளில் இயங்குகிறது: மூன்று பில்லியன் அளவுரு மாதிரி மற்றும் ஏழு பில்லியன் அளவுரு மாதிரி.

திறந்த மூல மாதிரியின் முக்கியத்துவத்தை விளக்கி, AISG கூறியது: “தற்போதுள்ள எல்எல்எம்கள் கலாச்சார விழுமியங்கள், அரசியல் நம்பிக்கைகள் மற்றும் சமூக மனப்பான்மைகள் ஆகியவற்றின் அடிப்படையில் வலுவான சார்புகளைக் காட்டுகின்றன. பயிற்சித் தரவுகள், குறிப்பாக இணையத்திலிருந்து துண்டிக்கப்பட்டவை, இதற்குக் காரணம். விகிதாச்சாரத்தில் பெரிய WEIRD அடிப்படையிலான தோற்றம் உள்ளது. WEIRD என்பது மேற்கத்திய, படித்த, தொழில்மயமான, பணக்கார, ஜனநாயக சமூகங்களைக் குறிக்கிறது. WEIRD அல்லாத வம்சாவளியைச் சேர்ந்தவர்கள் கல்வியறிவு, இணையத்தைப் பயன்படுத்த மற்றும் அவர்களின் வெளியீட்டை எளிதாக அணுகுவதற்கான வாய்ப்புகள் குறைவு.”

SEA-LION ஆனது “WEIRD அல்லாத” மக்களை சிறப்பாக பிரதிநிதித்துவப்படுத்தும் LLMகளை நிறுவுவதை நோக்கமாகக் கொண்டுள்ளது. அதன் பயிற்சி தரவு 981 பில்லியன் மொழி டோக்கன்களை உள்ளடக்கியது, டோக்கனைசேஷன் செயல்பாட்டின் போது உரையை உடைப்பதில் இருந்து உருவாக்கப்பட்ட சொற்களின் துண்டுகள் என AISG வரையறுக்கிறது. இந்த துண்டுகளில் 623 பில்லியன் ஆங்கில டோக்கன்கள், 128 பில்லியன் தென்கிழக்கு ஆசிய டோக்கன்கள் மற்றும் 91 பில்லியன் சீன டோக்கன்கள் அடங்கும்.

உள்ளூர்மயமாக்கப்பட்ட LLMகளை உருவாக்குவதற்கான முயற்சிகள் சிங்கப்பூரின் சமீபத்திய AI மூலோபாயத்தின் ஒரு பகுதியாகும், இது 2030 ஆம் ஆண்டிற்குள் AI தீர்வுகளுக்கான உலகளாவிய மேம்பாட்டு மையமாக இருக்க வேண்டும் என்ற அதன் லட்சியத்தை இயக்க முயல்கிறது. இந்த முயற்சிகள் அடுத்த காலத்தில் நாட்டில் AI நிபுணர்களின் எண்ணிக்கையை மும்மடங்காக 15,000 ஆக உயர்த்தும் திட்டங்களை உள்ளடக்கியது. மூன்று முதல் ஐந்து ஆண்டுகள் வரை மற்றும் AI நெறிமுறைகள் மற்றும் பாதுகாப்பு வழிகாட்டுதல்களுடன் இணைந்து நிர்வாகம், சோதனை மற்றும் தரப்படுத்தல் ஆகியவற்றை ஆதரிக்கும் ஒரு சுற்றுச்சூழல் அமைப்பை வழங்குவதற்கு.

AI இன் சமீபத்திய முன்னேற்றங்களால் உலகம் அறியப்படாத பிரதேசத்திற்குச் செல்கிறது என்பதைக் குறிப்பிட்டு, சிங்கப்பூரின் துணைப் பிரதமர் லாரன்ஸ் வோங் தேசிய AI மூலோபாயத்தின் தொடக்கத்தில் கூறினார்: “இதுவரை, AI முக்கியமாக மாதிரி அங்கீகாரத்தைப் பற்றியது. ஆனால் எதிர்காலத்தில், எங்களிடம் ஏஜென்சி மற்றும் பரிவர்த்தனை திறன்கள் கொண்ட AI அமைப்புகள் இருக்கும். மனிதனைப் போன்ற அறிவாற்றல் திறன்கள் மற்றும் சுய விழிப்புணர்வு மற்றும் சுயாதீனமாக முடிவெடுக்கும் திறன் கொண்ட இயந்திரங்கள் எங்களிடம் இருக்கும்.”

மனித வாழ்க்கையை கணிசமாக மாற்றும் திறன் மற்றும் சமூகங்களை பாதிக்கும் திறன் கொண்ட, AI இன் பொறுப்பான வளர்ச்சி மற்றும் தத்தெடுப்பு இன்னும் வேண்டுமென்றே வழிநடத்தப்பட வேண்டும், வோங் கூறினார்.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *