Ang mga kumpanya ng AI ay naglalayon na bumuo ng artificial intelligence na maaaring mag-isip tulad ng mga tao. Inilalapit ng OpenAI o1 ang sangkatauhan sa layuning iyon sa pamamagitan ng pagiging ang unang “pangangatwiran” na modelo ng AI.

Ang modelong ito ay maaaring humawak ng mas kumplikadong mga gawain kaysa sa kasalukuyang flagship na modelong GPT-4o. Kabilang dito ang mga problemang kinasasangkutan ng mga paksang STEM tulad ng physics, chemistry, at biology.

BASAHIN: Meta at OpenAI upang ilunsad ang mga modelo ng AI na may mga kasanayan sa ‘pangangatwiran’

Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito

Higit sa lahat, makikilala nito ang mga pagkakamali nito at mapagbuti ang mga tugon nito sa mga mapanghamong sitwasyon. Maaaring ma-access ng mga subscriber ng ChatGPT Plus ang OpenAI o1 sa pamamagitan ng tagapili ng modelo.

Paano gumagana ang modelo ng OpenAI o1?

Building OpenAI o1

Kung sinusubaybayan mo ang mga trend ng AI, ikalulugod mong malaman na ang o1 ay ang rumored Strawberry model sa development. Gayunpaman, sinabi ng The Verge na ang OpenAI ay hindi nagbibigay ng malinaw na mga detalye tungkol sa paglikha nito.

Sinabi ng pinuno ng pananaliksik sa OpenAI na si Jerry Tworek na ang o1 “ay sinanay gamit ang isang ganap na bagong algorithm ng pag-optimize at isang bagong datasheet ng pagsasanay na partikular na iniakma para dito.”

Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito

Hindi tulad ng mga nakaraang modelo, itinuro ng OpenAI ang pinakabagong modelo upang malutas ang mga problema gamit ang reinforcement learning, na nagtuturo sa system sa pamamagitan ng mga reward at parusa.

Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito

Ang pamamaraan na ito ay tila nagpapakita na ang modelo ng AI ay nagiging mas “tao” dahil ang reinforcement learning ay katulad ng Reinforcement Theory.

Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito

Sinasabi ng Simply Psychology na binuo ng psychologist na si BF Skinner (Burrhus Frederic Skinner) ang teorya, na kinabibilangan ng paghubog ng pag-uugali sa pamamagitan ng mga kahihinatnan.

Ang proseso ng “chain of thought” ng OpenAI o1 ay higit na nagpapatunay sa pagpapabuti nito ng mga kakayahan na tulad ng tao. Binibigyang-daan nito ang AI na dumaan sa mga problema nang sunud-sunod tulad ng mga tao.

Ang artikulo ay nagpapatuloy pagkatapos ng patalastas na ito

Ang bagong modelo ay nagtatakda ng sarili bukod sa GPT-4o sa pamamagitan ng mas mahusay na paglutas ng mga kumplikadong problema tulad ng matematika. Sinabi ng punong opisyal ng pananaliksik ng OpenAI na si Bob McGrew sa The Verge:

“Ang modelo ay talagang mas mahusay sa paglutas ng pagsusulit sa AP matematika kaysa sa akin, at ako ay isang menor de edad sa matematika sa kolehiyo.”

Idinagdag ni Tworek, “May mga paraan kung saan ito nararamdaman na mas tao kaysa sa mga naunang modelo.” Ang modelo ay may limitadong oras upang iproseso ang mga query, kaya maaari itong sabihin tulad ng, “Naku, nauubusan na ako ng oras, hayaan mo akong makakuha ng sagot nang mabilis.”

Ang OpenAI o1 ay mayroon ding mas maliit na bersyon, o1-mini, na isang mas mabilis, mas murang modelo ng pangangatwiran na angkop para sa coding. Sinasabi ng Interesting Engineering na ito ay perpekto para sa mga aplikasyon na nangangailangan ng pangangatwiran nang walang malawak na kaalaman sa mundo.

Maaari mong i-access ang o1 at o1-mini sa pamamagitan ng pag-subscribe sa ChatGPT Plus sa halagang $20 buwan-buwan. Pagkatapos, mag-log in at piliin ang mga ito sa pamamagitan ng tagapili ng modelo.

Share.
Exit mobile version