Inanunsyo ng Google noong Miyerkules ang paglulunsad ng Gemini 2.0, ang pinaka-advanced na modelo ng artificial intelligence nito hanggang sa kasalukuyan, habang ang mga tech giant sa mundo ay naghahabol na manguna sa mabilis na pagbuo ng teknolohiya.
Sinabi ng CEO na si Sundar Pichai na mamarkahan ng bagong modelo ang tinatawag ng kumpanya na “isang bagong agentic na panahon” sa pagbuo ng AI, na may mga modelo ng AI na idinisenyo upang maunawaan at gumawa ng mga desisyon tungkol sa mundo sa paligid mo.
“Ang Gemini 2.0 ay tungkol sa paggawa ng impormasyon na mas kapaki-pakinabang,” sabi ni Pichai sa anunsyo, na nagbibigay-diin sa pinahusay na kakayahan ng modelo na maunawaan ang konteksto, mag-isip ng maraming hakbang sa unahan at gumawa ng mga pinangangasiwaang aksyon sa ngalan ng mga user.
Ang mga pag-unlad ay “naglalapit sa amin sa aming pananaw ng isang unibersal na katulong,” idinagdag niya.
Ang paglabas ay nagpadala ng mga bahagi sa Google na tumaas ng higit sa apat na porsyento sa Wall Street isang araw pagkatapos na ang stock ay nakakuha na ng 3.5 porsyento pagkatapos ng paglabas ng isang pambihirang tagumpay na quantum chip.
Ang mga tech giant ay galit na galit na gumagawa ng mga hakbang upang maglabas ng mas makapangyarihang mga modelo ng AI sa kabila ng kanilang napakalaking gastos at ilang mga katanungan tungkol sa kanilang agarang pagiging kapaki-pakinabang sa mas malawak na ekonomiya.
Ang isang “ahente” ng AI, ang pinakabagong trend ng Silicon Valley, ay isang digital na katulong na dapat na makadama ng kapaligiran, gumawa ng mga desisyon, at gumawa ng mga aksyon upang makamit ang mga partikular na layunin.
Nangangako ang mga tech giant na ang mga ahente ang magiging susunod na yugto ng isang AI revolution na pinasimulan ng 2022 na paglulunsad ng ChatGPT, na nanaig sa mundo.
Ang Gemini 2.0 ay unang inilunsad sa mga developer at pinagkakatiwalaang tester, na may mga plano para sa mas malawak na pagsasama sa mga produkto ng Google, partikular sa Search at sa Gemini platform.
– Walang Nvidia –
Ang teknolohiya ay pinapagana ng ika-anim na henerasyong TPU (Tensor Processing Unit) hardware ng Google, na tinatawag na Trillium, na ngayon ay ginawang available ng kumpanya sa pangkalahatan sa mga customer.
Binigyang-diin ng Google na ang mga processor ng Trillium ay ginamit nang eksklusibo para sa parehong pagsasanay at pagpapatakbo ng Gemini 2.0.
Karamihan sa pagsasanay sa AI ay na-monopolyo ng chip juggernaut Nvidia, na na-catapulted ng pagsabog ng AI upang maging isa sa pinakamahalagang kumpanya sa mundo.
Sinabi ng Google na milyun-milyong developer ang gumagawa na ng mga application gamit ang Gemini technology, na isinama sa pitong produkto ng Google, bawat isa ay nagsisilbi ng higit sa dalawang bilyong user.
Ang mga kapangyarihan ng Gemini 2.0 ay inaasahang darating sa unang bahagi ng 2025 sa application ng paghahanap ng Google, ang pangunahing gumagawa pa rin ng pera ng kumpanya.
Ang unang release mula sa 2.0 na pamilya ng mga modelo ay ang Flash, na nag-aalok ng mas mabilis na performance habang pinangangasiwaan ang maraming uri ng input (text, larawan, video, audio) at output (kabilang ang mga nabuong larawan at pananalita).
Ang mga gumagamit ng Gemini sa buong mundo ay maaari nang mag-tap sa isang chat-only na bersyon ng Flash, sinabi ng kumpanya, na may mga tester na binigyan ng access sa isang multimodal na bersyon na maaaring magbigay-kahulugan sa mga imahe at kapaligiran.
Sinabi rin ng Google na nag-eeksperimento ito sa isang produkto na maaaring gumamit ng software apps, mga website at iba pang mga online na tool, katulad ng isang user ng tao. Ang OpenAI at Anthropic ay naglabas ng mga katulad na tampok.
Tinukso din ng kumpanya ang isang bagong bersyon ng Project Astra, isang smartphone digital assistant tulad ng Apple’s Siri na tumutugon sa mga larawan pati na rin sa mga verbal command.
arp/des