ஆப்பிள் ஐபோன்கள் மற்றும் ஐபேட்களில் AI ஐ இயக்கும் பணியில் ஈடுபட்டுள்ளது

ஆப்பிள் ஆராய்ச்சியாளர்கள் வீடியோக்களில் இருந்து யதார்த்தமாக தோற்றமளிக்கும் அவதாரங்களை உருவாக்குவதற்கான நுட்பத்தை உருவாக்க உதவியுள்ளனர்.

உருவாக்கப்படும் AI இன் சாத்தியங்களை விரிவுபடுத்தும் வகையில் ஆப்பிள் இரண்டு ஆய்வுக் கட்டுரைகளை வெளியிட்டுள்ளது. வரையறுக்கப்பட்ட டைனமிக் ரேண்டம் அணுகல் நினைவகத்துடன் சில சாதனங்களில் பெரிய மொழி மாதிரிகள் இயங்குவதைத் தடுக்கும் சிக்கலை ஒரு தாள் தீர்க்கிறது. தாள் ஐபோன்கள் மற்றும் ஐபாட்களைக் குறிப்பிடவில்லை, ஆனால் ஆப்பிள் தனது சொந்த சாதனங்களில் இந்த நுட்பத்தை செயல்படுத்த முயற்சிக்கும்.

ஒற்றை கேமரா வீடியோக்களிலிருந்து 3D அவதாரங்களை உருவாக்குவதற்கான ஒரு நுட்பமான “Human Gaussian Splats” என்பதை இரண்டாவது தாள் விவரிக்கிறது, இது மெய்நிகர் சந்திப்புகளுக்கான அவதாரங்களை உருவாக்க அல்லது ஆன்லைன் சில்லறை விற்பனையாளர்களிடமிருந்து ஆடைகளை வாங்குவதற்கு முன் நுகர்வோர் அவற்றை முயற்சி செய்ய அனுமதிக்கும்.

ஃபிளாஷ் நினைவகத்துடன் எல்எல்எம் அனுமான விலை மாதிரியை கலத்தல்

பயன்பாடுகளில் LLM-இயங்கும் திறன்களைச் சேர்ப்பதில் அதிகமான நிறுவனங்கள் செயல்படுவதால், சாதனங்களில் சொந்தமாக இயங்குவதற்கு அந்தப் பயன்பாடுகள் தேவை. இதற்கு ஒரு சவால் என்னவென்றால், LLM இன் “தீவிர கணக்கீட்டு மற்றும் நினைவகத் தேவைகள் சவால்களை முன்வைக்கின்றன, குறிப்பாக வரையறுக்கப்பட்ட DRAM திறன் கொண்ட சாதனங்களுக்கு,” Apple ஆராய்ச்சியாளர்கள் “LLM in a flash: Efficient Large Model Inference with Limited Memory” என்ற தாளில் எழுதினர்.

ஆராய்ச்சியாளர்கள் “விண்டோவிங்” மற்றும் “ரோ-நெடுவரிசை தொகுப்பு” என்று இரண்டு நுட்பங்களைப் பயன்படுத்தி எல்எல்எம்களை ஃபிளாஷ் நினைவகத்தில் சேமிப்பதன் மூலம் கிடைக்கக்கூடிய டிராம்களை விட இரண்டு மடங்கு அதிகமாக தேவைப்படும் எல்எல்எம்களை இயக்க முடியும் என்று ஆராய்ச்சியாளர்கள் கண்டறிந்தனர். விண்டோயிங் மூலம், DRAM இன் தேவை குறைக்கப்படுகிறது, ஏனெனில் செயல்முறைகள் மீண்டும் பயன்படுத்தப்பட்ட டிஜிட்டல் நியூரான்களில் செய்யப்படுகின்றன, புதிய டிஜிட்டல் நியூரான்கள் அல்ல. வரிசை-நெடுவரிசை தொகுத்தல், ஃபிளாஷ் நினைவகத்திலிருந்து படிக்கும் தரவுகளின் பகுதிகளை பெரிதாக்குகிறது.

இந்த இரண்டு நுட்பங்களும் “ஃபிளாஷ் நினைவக நடத்தையுடன் இணக்கமான ஒரு அனுமான செலவு மாதிரியை உருவாக்குவதற்கு முக்கியமானவை, இரண்டு முக்கியமான பகுதிகளில் மேம்படுத்துவதற்கு நம்மை வழிநடத்துகிறது: ஃபிளாஷிலிருந்து மாற்றப்படும் தரவின் அளவைக் குறைத்தல் மற்றும் பெரிய, அதிக தொடர்ச்சியான துகள்களில் தரவைப் படிப்பது” ஆராய்ச்சியாளர்கள் எழுதினர்.

DRAM இல் மிகவும் திறமையான LLM செயல்பாட்டிற்கான வணிக பயன்பாட்டு வழக்குகள்

இந்த மேம்பாடு வணிக பயன்பாட்டு நிகழ்வுகள் மற்றும் நுகர்வோர் போன்றவற்றில் இறங்கலாம், இது LLM களை சிறிய, நினைவகம் கட்டுப்படுத்தப்பட்ட, விளிம்பு அல்லது கள சேவை சாதனங்களில் இயக்க அனுமதிக்கும். ஆராய்ச்சியாளர்கள் தங்கள் பணி மேலும் ஆராய்ச்சிக்கு “ஒரு முன்னுதாரணத்தை அமைக்கிறது” என்று கூறுகிறார்கள்; அந்த ஆராய்ச்சியில் ஒப்பீட்டளவில் சிறிய சாதனங்களுக்கு உருவாக்கக்கூடிய AI ஐ மேம்படுத்துவதும், அதற்கு நேர்மாறாகவும் இருக்கலாம். குறிப்பாக, ஆப்பிள் ஐபோன்கள் மற்றும் ஐபாட்களில் ஜெனரேட்டிவ் AI ஐ அறிமுகப்படுத்துவதை இது எளிதாக்கும்.

மனித காஸியன் ஸ்ப்ளாட்டுகள் யதார்த்தமான 3D அவதாரங்களை உருவாக்குகின்றன

ஆப்பிள், மேக்ஸ் பிளாங்க் இன்ஸ்டிடியூட் ஃபார் இன்டலிஜென்ட் சிஸ்டம்ஸ் மற்றும் ETH சூரிச் ஆகியவற்றின் ஆராய்ச்சியாளர்களால் எழுதப்பட்ட இரண்டாவது கட்டுரை, 3D அவதாரங்களை உருவாக்கும் முறையை விவரிக்கிறது. ஆராய்ச்சியாளர்கள் ஒரு குறுகிய, ஒற்றை-கேமரா வீடியோவுடன் தொடங்கி, அதிலிருந்து மனித காஸியன் ஸ்ப்ளாட்ஸ் எனப்படும் நரம்பியல் ரெண்டரிங் கட்டமைப்பைப் பயன்படுத்தி 3D அவதாரத்தை உருவாக்கினர். சில படங்களில் பயன்படுத்தப்பட்டது போன்ற முந்தைய வீடியோ-க்கு-3D மாற்றமானது பல கேமராக்கள் மற்றும் அதிக கணினி சக்தி மற்றும் மனித முயற்சியை எடுத்தது.

மேலும் படிக்க வேண்டிய AI கவரேஜ்

ஒரு வீடியோவின் 50-100 பிரேம்களைப் பயன்படுத்தி, மனித காஸியன் ஸ்ப்ளாட்டுகள் அவதாரத்திற்கான புத்தம் புதிய போஸ்களையும் அசைவுகளையும் உருவாக்க முடியும். நரம்பியல் ரெண்டரிங் கட்டமைப்பானது, வீடியோவில் முழுமையாகப் பிடிக்கப்படாத மனித உடலின் பாகங்களை “நிரப்புகிறது”.

வீடியோ-டு-அவதார் திறன்களுக்கான சாத்தியமான வணிக பயன்பாட்டு வழக்குகள்

“AR/VR, விஷுவல் எஃபெக்ட்ஸ், விஷுவல் ட்ரை-ஆன் (மற்றும்) திரைப்படத் தயாரிப்பு” உள்ளிட்ட பல்வேறு வகையான பயன்பாடுகளை ஆராய்ச்சியாளர்கள் முன்மொழிகின்றனர். மெட்டாவால் முன்மொழியப்பட்ட வணிக சந்திப்புகளுக்கான மெய்நிகர் அவதாரங்கள் பிரபலமாகவில்லை என்றாலும், சில்லறை விற்பனையாளர்கள் வாடிக்கையாளர்களை தங்கள் சொந்த உடல்களில் உள்ள ஆடைகளைப் பார்ப்பதற்காக ஒரு மெய்நிகர் மாற்றும் அறைக்குள் நுழைய அனுமதிப்பதில் தொடர்ந்து பரிசோதனை செய்து வருகின்றனர். 3D அவதார்களை மிகவும் திறமையாகவும், குறைவான செயலாக்க ஆற்றலுடனும் உருவாக்குவது அந்த செயல்முறையை எளிதாக்கலாம்.

உருவாக்கும் AI இடத்தில் ஆப்பிள் முன்னேற்றம்

மைக்ரோசாப்டின் காபிலட் அல்லது ஓபன்ஏஐயின் சாட்ஜிபிடி போன்ற உயர்மட்ட AI தயாரிப்புகளை ஆப்பிள் இன்று கொண்டிருக்கவில்லை என்றாலும், உருவாக்கப்படும் AI இடத்தில் ஆப்பிள் இன்னும் கை வைத்திருக்கிறது என்பதை இரண்டு ஆவணங்களும் காட்டுகின்றன. இந்த கண்டுபிடிப்புகள் இறுதியில் மடிக்கணினிகள், டேப்லெட்டுகள் மற்றும் ஃபோன்களில் வசிக்கும் ஆப்பிளின் குரல் அடிப்படையிலான உதவியாளரான சிரியில் இணைக்கப்படலாம்.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *