Ang Google, Microsoft, at halos lahat ng iba pang tech na kumpanya ay nakipagsiksikan sa AI craze, ngunit nasaan ang Apple? Maaaring hindi alam ng karamihan ang mga proyekto ng artificial intelligence ng iPhone firm. Kaya naman kinumpirma ng CEO na si Tim Cook na ang kanyang kumpanya ay gumagawa ng mga produkto at serbisyo ng AI, at ang MGIE ay isa sa pinakabago. Ito ay isang programa na nag-e-edit ng mga larawan mula sa mga text prompt.
Halimbawa, maaari kang magsumite ng isang larawan at sabihin ito upang taasan ang liwanag. Bilang tugon, papalakasin ng MGIE ang saturation ng imahe para mas madaling makita. Inamin ng Apple na ang mga kakumpitensya nito ay may katulad na mga tampok ngunit sinasabing naiintindihan ng MGIE ang mas maikling mga utos ng teksto. Bilang resulta, maaari itong maging mas madaling gamitin kaysa sa DALL-E at Stable Diffusion.
Talakayin natin ang layunin at tampok ng bagong Apple AI image editor. Mamaya, ibabahagi ko ang ilan sa iba pang mga proyekto ng artificial intelligence ng kumpanya.
Paano gumagana ang Apple AI?
Ang tool ng AI sa pag-edit ng larawan ng Apple ay MGIE, na nangangahulugang “MLLM-Guided Image Editing.” Ang ibig sabihin ng MLLM ay mga multimodal na malalaking modelo ng wika at ang “multimodal” na aspeto ay nangangahulugan na maaari itong magproseso ng teksto at mga larawan.
Sinasabi ng VentureBeat na ang Apple AI ay gumagamit ng mga MLLM sa dalawang paraan. Una, gumagamit ang programa ng mga MLLM upang makakuha ng mga nagpapahayag na tagubilin mula sa input ng user. Ang mga ito ay sapat na malinaw at maigsi upang gabayan ang proseso ng pag-edit.
Halimbawa, sabihin dito na “gawing mas bughaw ang kalangitan,” at “tataasin ng MGIE ang saturation ng rehiyon ng kalangitan ng 20%.”
Pangalawa, gumagamit ito ng mga MLLM upang makabuo ng visual na imahinasyon, na kumukuha ng esensya ng pag-edit at maaaring magamit upang gabayan ang mga pagsasaayos sa antas ng pixel. Sa madaling salita, ginagawa nitong mga manipulasyon ang iyong mga utos na dapat gawin ng program.
Binuo ng Apple ang AI kasama ang mga mananaliksik ng Unibersidad ng California, ngunit inamin nila na hindi ito ang unang programa na may ganitong mga tampok. Halimbawa, maaari mong gawin ang parehong sa Stable Diffusion at DALL-E.
Ang tool ng Apple AI ay nagbubukod sa sarili dahil naiintindihan nito ang mga maiikling utos ng user. “Ang mga tagubilin ng tao ay kung minsan ay masyadong maikli para sa kasalukuyang mga pamamaraan upang makuha at sundin,” sabi ng papel sa pananaliksik nito.
Maaari mo ring magustuhan: Pinahihintulutan ng mga sasakyan ng Mercedes-Benz ang mga voice command ng ChatGPT
Kadalasan, dapat kang magbigay ng maraming detalye upang makuha ang eksaktong gusto mo mula sa mga programang ito na bumubuo ng imahe. Sa kabilang banda, tila naiintindihan ng MLLM ng Apple ang mga maikling utos nang malinaw.
Ang tool ay maaari ding magdagdag ng mga bagay batay sa mga paglalarawan ng user. Halimbawa, sinabi ng mga mananaliksik na gumawa ng isang larawan ng isang pizza na mas malusog, kaya ang MGIE ay nagdagdag ng mga gulay.
Pinatunayan ng MGIE na gustong makipagkumpetensya ng Apple sa merkado ng AI. Gayunpaman, hindi nito nakumpirma ang pag-aalok ng mga produkto at serbisyo sa hinaharap gamit ang teknolohiyang ito. Maaari mong subukan ang MGIE sa Hugging Face webpage na ito at magbasa pa tungkol dito sa arXiv.
Ano ang iba pang mga proyekto ng AI ng Apple?
Gumagawa ang Apple ng mga serbisyo sa kalusugan ng isip na pinapagana ng AI gamit ang Quartz app. Ito ay “papanatilihin ang mga gumagamit na mag-udyok na mag-ehersisyo, pagbutihin ang mga gawi sa pagkain, at tulungan silang matulog nang mas mahusay.”
Maaari mong basahin ang tungkol dito sa aking iba pang artikulo. Gayundin, sinabi ng tagaloob ng Apple na si Mark Gurman na ang kumpanya ng iPad ay bumubuo ng isang AI chatbot upang karibal sa ChatGPT.
Mayroon itong dalawang bahagi: Ajax at AppleGPT. Ang una ay “isang platform para sa paglikha ng malalaking modelo ng wika na nagbibigay-daan sa AI chatbots.” Ito ay katulad ng modelo ng malaking wika ng OpenAI’s GPT-4.
Maaari mo ring magustuhan ang: Ang mag-aaral na Pilipino ay gumagawa ng mga costume ng AI na hango sa mito
Ang huli ay ang interface na nagbibigay-daan sa mga tao na gumamit ng Ajax. Sinabi ni Gurman na ang AppleGPT ay kahawig ng mga kakumpitensya na masyadong malapit sa anumang bagay na groundbreaking.
Maaaring limitado ng Apple ang tool dahil nakatuon ito sa pagpapabuti ng privacy kapag gumagamit ng generative AI. Kasama sa trabaho ang pagsubok na tugunan ang mga potensyal na alalahanin sa privacy na may kaugnayan sa teknolohiya, “paliwanag niya.
Sinasabi rin ni Mark Gurman na walang sinuman ang maaaring gumamit ng output ng generative AI tool. “Anumang output mula dito ay hindi magagamit upang bumuo ng mga feature na nakatali para sa mga customer.” Maaari mong basahin ito sa aking nakaraang ulat. Bukod dito, tingnan ang pinakabagong mga digital trend sa Inquirer Tech.
MGA PAKSA: