Inihayag ni Elon Musk na ang kanyang kumpanya ng xAI ay mag-a-upgrade ng AI chatbot na Grok sa susunod na linggo. Sinabi niya sa X, “Dapat lumampas ang Grok 2 sa kasalukuyang AI sa lahat ng sukatan.”
Sa kabila ng kanyang pahayag, ang paparating na bersyon ng AI bot ay 1.5. Sinasabi ng opisyal na pahina na “Ang Grok-1.5 ay may pinahusay na kakayahan sa pangangatwiran at haba ng konteksto na 128,000 token.”
Ayon sa VentureBeat, ang paparating na artificial intelligence (AI) ay malapit na sa pagganap ng GPT-4, ang malaking modelo ng wika na nagpapagana sa sikat na ChatGPT.
Dapat na available sa ๐ sa susunod na linggo.
Ang Grok 2 ay dapat lumampas sa kasalukuyang AI sa lahat ng sukatan. Sa training ngayon. https://t.co/s7rVxvK8mZ
โ Elon Musk (@elonmusk) Marso 29, 2024
BASAHIN: Ang xAI ni Elon Musk upang ilunsad ang pinahusay na bersyon ng chatbot
Sinabi ng kumpanya ng Musk na nakamit ng Grok-1.5 ang matataas na marka sa mga sikat na benchmark ng AI, lalo na:
- MMLU (Massive Multitask Language Understanding): Ang platform ng AI builder na Klu AI ay tinukoy ito bilang “isang magkakaibang hanay ng mga pagsubok na idinisenyo upang suriin ang pag-unawa at paglutas ng mga kakayahan ng mga modelo ng wika sa maraming domain.”
- MATH Benchmark (Math Word Problem Solving): Ipinapaliwanag ng site ng pagsubok ng AI na Metaculus na ito ay “isang benchmark upang masukat ang kakayahan sa paglutas ng problema sa matematika ng (AI) na mga modelo.”
- GSM8K (Grade School Math 8K): Sinabi ng Klu AI na ito ay “isang dataset ng 8,500 mataas na kalidad, linguistically diverse grade school math word problems.”
- HumanEval: Sinabi ni Klu na “sinusuri nito ang mga kakayahan sa pagbuo ng code ng malalaking modelo ng wika (LLM).”
Sa partikular, ang paparating na bersyon ng Grok ay nakakuha ng 81.3 porsiyento sa MMLU, 50.6 porsiyento sa MATH, 90 porsiyento sa GSM8K, at 74.1 porsiyento sa HumanEval.
Sa kabilang banda, ang GPT-4 ng OpenAI ay nakakuha ng 86.4 porsyento, 52.9 porsyento, 92 porsyento, at 67 porsyento ayon sa pagkakabanggit. Nangangahulugan iyon na ang Grok-1.5 ay malamang na gumanap nang mas mahusay kaysa sa ChatGPT sa paglutas ng mga problema sa matematika.
Gumaganda rin ang Grok hanggang sa puntong halos nasa antas na ito ng GPT-4 dahil ang bersyon 1.5 nito ay inaasahang magkakaroon ng kakayahang magproseso ng 128,200 token, na tumutukoy sa mga piraso ng hilaw na teksto.
BASAHIN: Si Elon Musk ay maaaring bumubuo ng isang AI chatbot karibal sa ChatGPT
Sinabi ng TechCrunch na ang AI chatbots ay may posibilidad na hatiin ang mga salita sa maraming token. Halimbawa, maaari nitong hatiin ang salitang “fantastic” sa “fan,” “tas,” at “tic.”
Sinabi ng opisyal na webpage ng xAI na ang pag-upgrade ng chatbot ay “nagbibigay-daan sa Grok na magkaroon ng mas mataas na kapasidad ng memorya ng hanggang 16 na beses sa nakaraang haba ng konteksto.” Bilang resulta, maaaring pangasiwaan ng Grok-1.5 ang “mga mas mahabang dokumento.”
Gayunpaman, ipinaalala ng TechCrunch sa publiko na ang mga benchmark ng AI ay hindi nagpapakita kung paano makikipag-ugnayan ang mga karaniwang tao sa mga programang ito ng AI.
Sinasabi ng website ng X Help Center na ang Grok ay available sa mga subscriber ng X Premium+, na nagkakahalaga ng $16 buwan-buwan o $168 taun-taon.