Ang kumpanya ng Chinese AI na DeepSeek noong Miyerkules ay inihayag ang DeepSeek-R1, na iniulat na tumutugma sa pinakabagong modelo ng OpenAI, o1.
Isa itong modelo ng pangangatwiran, ibig sabihin, sinusuri nito ang sarili bago gumawa ng resulta. Dahil dito, iniiwasan nito ang ilan sa mga pagkakamali na karaniwang ginagawa ng mga modelo ng AI.
Maaaring pag-aralan ng R1 ang mga gawain, magplano, at magsagawa ng magkakasunod na pagkilos upang makarating sa isang sagot. Gayunpaman, maaaring tumagal ng 10 segundo o higit pa bago matapos ang proseso.
Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito
Ano ang mga tampok ng DeepSeek R1?
Ang magagamit na bersyon sa oras ng pagsulat ay ang DeepSeek-R1-Lite-Preview. Sa kabila ng pagiging modelo ng preview, tumutugma ito sa pagganap ng o1 sa mga benchmark ng AIME at MATH.
Sinabi ng TechCrunch na ang AIME ay gumagamit ng iba pang mga modelo ng AI upang suriin ang pagganap ng isang modelo. Sa kabilang banda, ang MATH ay gumagamit ng mga word problem.
BASAHIN: Ang OpenAI o1 ay ang unang ‘pangangatwiran’ na modelo ng ChatGPT
Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito
Sa kabila ng kalidad nito, ang R1 ay may mga bahid pa rin sa ibang mga modelo. Halimbawa, sinasabi ng ilang nagkokomento sa X (Twitter) na nakikipagpunyagi ito sa mga problema sa lohika.
Bukod dito, madaling ma-jailbreak ng mga tao ang system, ibig sabihin ay makakapagbigay sila ng mga partikular na utos upang alisin ang mga limitasyon nito.
Halimbawa, niloko ng isang X user si R1 sa pagbibigay ng detalyadong recipe para sa methamphetamine o meth.
Iniiwasan din ng DeepSeek-R1 ang mga tanong na mukhang sensitibo sa pulitika. Nalaman ng TechCrunch na hindi nito sinasagot ang mga tanong tungkol sa Chinese President Xi Jinping, Tiananmen Square, at pagsalakay ng China sa Taiwan.
Ang mga limitasyong ito ay malamang na dahil sa regulasyon sa internet ng gobyerno ng China, na nagsisiguro ng mga tugon na “naglalaman ng mga pangunahing sosyalistang halaga.”
BASAHIN: Meta at OpenAI upang ilunsad ang mga modelo ng AI na may mga kasanayan sa ‘pangangatwiran’
Sa ngayon, mas maraming kumpanya ang tumutuon sa mga modelo ng pangangatwiran dahil ang mga pinakabagong modelo ng malalaking wika ay hindi gaanong umuunlad tulad ng dati.
Dahil dito, ang mga kumpanya ay nagpatibay ng ibang diskarte, tulad ng pagbuo ng mga modelo ng pangangatwiran. Ang mga modelong ito ay nangangailangan ng karagdagang oras sa pagpoproseso upang makumpleto ang mga gawain.
“Nakikita namin ang paglitaw ng isang bagong batas sa pag-scale,” sabi ng CEO ng Microsoft na si Satya Nadella sa isang pangunahing tono sa kumperensya ng Microsoft’s Ignite.
Sinabi ng TechCrunch na ilalabas ng DeepSeek ang R1 bilang isang open-source na programa at ang itinalagang API nito.