Sa gitna ng paglabas ng GPT-4o ng OpenAI, inihayag ng Google ang AI contender nito: Project Astra. Ang modelo ng AI ay may katulad na mga tampok sa punong barko ng OpenAI, na nagpapakita ng lumalaking tunggalian sa industriya ng AI.
Tulad ng GPT-4o, gumagana ang Google Astra bilang isang real-time na assistant na tumutukoy sa mga bagay sa kapaligiran ng isang user.
BASAHIN: Paano gumawa ng sarili mong AI assistant
Maaari itong basahin at bigyang-kahulugan ang computer code sa real-time at kahit na maunawaan ang mga simbolo sa isang pisara. Gayunpaman, sapat ba ang mga ito upang talunin ang GPT-4o?
Ang demo ng Google Astra
Noong Mayo 14, 2024, inilabas ng AI division ng Google na DeepMind ang Project Astra. Ang salitang “Astra” ay isang acronym para sa “Advanced Seeing and Talking Responsive Agent.”
Ang video sa itaas ay nagpapakita ng mga kakayahan ng Astra sa pamamagitan ng isang kinatawan na naglalakad sa isang opisina. Magsisimula ang user sa pamamagitan ng pag-on sa bot sa kanyang telepono.
Pagkatapos, tatanungin ng user ang bot kung may nakikita itong tumutunog. Itinuturo ng AI ang speaker na nakikita sa camera ng telepono.
Tinanong ng user ang Project Astra tungkol sa pangalan ng itaas na bahagi ng speaker, at sinabi ng AI na ang bahagi ay isang tweeter.
Ang pares ay nakatagpo ng isang mug ng mga lapis, at ang gumagamit ay humihingi ng isang alliteration tungkol sa mga bagay na ito. Tinukoy ng Oregon State University ang isang alliteration bilang:
“Ang aliteration ay ang pag-uulit ng parehong tunog sa simula ng sunud-sunod na mga salita na ang layunin ay magbigay ng naririnig na pulso na nagbibigay sa isang piraso ng pagsulat ng nakakahimbing, liriko, at/o emotibong epekto.”
Sa paglaon, ang user ay nag-pan sa isang computer na nagpapakita ng isang linya ng code at hinihiling sa AI na ilarawan ang code, at ipinapaliwanag ng Astra ang function ng code.
Tumingin sila sa bintana, at inilalarawan ni Astra kung ano ang nasa labas. Susunod, tatanungin ng user kung naaalala nito kung nasaan ang kanyang salamin, at sinasagot ng bot na malapit ito sa isang mansanas sa isang mesa.
BASAHIN: PH-inspired game na Until Then naglabas ng demo
Pagkatapos ay hihilingin ng user sa Project Astra na ipaliwanag ang isang diagram sa isang whiteboard, at pagkatapos ay bigla niyang itinuro ang kanyang telepono sa dalawang sketch ng pusa at isang kahon, na hinihiling sa AI na ilarawan kung ano ang nakikita nito.
Sumagot ito, “Schrödinger’s Cat.” Ang huli ay isang pag-iisip na eksperimento sa quantum mechanics ni Erwin Schrödinger.
Google Astra kumpara sa OpenAI GPT-4o
Samantala, ang Google DeepMind research scientist na si Micheal Chang ay gumawa ng kalokohang jab sa GPT-4o ng OpenAI sa kanyang pinakabagong video.
Ang clip ay nagpapakita ng Google Gemini, na pinapagana ng Google Astra, na nagsasalin sa pagsisiwalat ng produkto. Nai-post ito ni Chang sa X na may caption na:
“Nagkaroon din kami ni Gemini ng pagkakataong panoorin ang @OpenAI live announcement ng gpt4o, gamit ang Project Astra! Congrats sa OpenAI team, sobrang kahanga-hangang gawa!”
Gayunpaman, ang OpenAI at Google demo ay nagpapakita ng mga kawili-wiling pagkakaiba sa pagitan ng Project Astra at GPT-4o.
Pinatunayan ng huli na maaari itong magsalin sa pagitan ng dalawang taong nagsasalita ng magkaibang wika. Bukod dito, maaari nitong gabayan ang isang tao sa pagtatapos ng araling-bahay, na ginagawa itong isang promising tool sa pag-aaral.
Masasabing, ang pinakamahalagang bentahe nito ay ang mas nakakumbinsi nitong boses na parang tao. Mas natural ang boses ng GPT-4o, nagdaragdag ng mga paghinto at intonasyon na makikita sa normal na pagsasalita ng tao.
Ang parehong mga tampok na ito ay maaaring gawing mas madaling lapitan ang bagong punong barko ng OpenAI sa pangkalahatang publiko. Gayunpaman, maaari lamang naming kumpirmahin ang kanilang mga kakayahan sa kanilang mga huling release.