Makakapagsagawa ang modernong artificial intelligence ng mga kamangha-manghang gawa tulad ng paggawa ng mga text na tulad ng tao, photorealistic na larawan, at mga video na kapani-paniwala.
Gayunpaman, marami ang hindi nakakaalam na ang nakakagulat na dami ng data ng pagsasanay ay nasa likod ng mga kamangha-manghang tampok na ito. Kung mas maraming impormasyon ang ipapakain mo sa isang tool ng AI, mas malamang na maging isang advanced na programa.
Naiintindihan ng Amazon ang pangkalahatang tuntuning ito ng pagbuo ng artificial intelligence, kaya lumikha ito ng isang sinanay sa 100,000 oras ng data ng pagsasalita! Dahil dito, ang BASE TTS nito ang naging pinakamalaking text-to-speech na modelo hanggang sa kasalukuyan. Ang kasaganaan ng data ng pagsasanay ay nagbibigay dito ng “state-of-the-art na naturalness” at “emergent” na mga katangian.
Ano ang mga tampok ng pinakamalaking text-to-speech AI?
Tinukoy ng opisyal na BASE TTS na papel ang acronym bilang “Big Adaptive Streamable TTS na may Emergent Abilities.” Nagsanay ito sa 100,000 oras ng public domain speech data, na ginagawa itong pinakamalaking text-to-speech (TTS) na modelo sa oras ng pagsulat.
Gumagamit ito ng 1-bilyong-parameter na autoregressive Transformer na ginagawang mga discreet code ang hilaw na text na tinatawag na mga speech code. Pagkatapos, ginagawang waveform ng convolution-based decoder ang mga speechcode sa isang incremental, streamable na paraan.
Sinanay din ng kumpanya ang mas maliliit na variant ng BASE TTS sa 10,000 oras ng pagsasalita at 500 milyong mga parameter. Bilang resulta, inilarawan nito na ang pinakamalaking text-to-speech AI nito ay nakabuo ng “mga lumilitaw na kakayahan.”
Inilista ng isang nakaraang artikulo ang pinakamahalagang termino ng AI. Sinasabi nito na ang lumilitaw na pag-uugali ay nangyayari kapag ang isang AI program ay nagpapakita ng mga hindi sinasadyang pag-uugali.
BASAHIN: 6 Pinakamahusay na Mouse Pad ng 2022
Binanggit ng manunulat na ito ang dating Bard chatbot ng Google na natutunan ang wikang Bengali sa kabila ng hindi nakakatanggap ng nauugnay na pagsasanay. Higit sa lahat, sinabi ng Amazon na ang BASE TTS ay isang “high-fidelity model na may kakayahang gayahin ang mga katangian ng speaker sa ilang segundo lang ng reference na audio.”
Ang opisyal na BASE TTS webpage ay nagtatampok ng ilang sample ng boses na ginawa ng text-to-speech program. Ang mga halimbawa nito sa US English ay nagpapakita kung paano ito makapaghahatid ng mga banayad na inflection ng tao tulad ng sarcasm.
Nagbibigay din ang page ng mga clip ng British English at US Spanish na nagpapatunay sa versatility ng test-to-speech AI. Gayunpaman, inamin ng kumpanya na ang proyekto ay nangangailangan ng karagdagang pananaliksik at pag-unlad bago ito ilabas sa merkado.
Ano ang iba pang mga proyekto ng AI ng Amazon?
#AWS ipinakilala ang #GenerativeAI Innovation Center. ๐ฃ
Nag-aalok ang program na ito ng mga workshop, pakikipag-ugnayan, at pagsasanay na naglalayong tulungan ang mga organisasyon na bumuo at mag-deploy ng mga generative AI solution sa suporta ng mga eksperto sa AWS AI at ML.
Matuto pa. ๐ https://t.co/Ja4716QQEZ pic.twitter.com/kAOC6meqFZ
โ Amazon Web Services (@awscloud) Hunyo 22, 2023
Ang Amazon ay isang pandaigdigang pangalan para sa online shopping. Nasaan ka man, malamang na narinig mo o nagamit mo na ang mga serbisyo nito. Gayunpaman, kinikilala nito na dapat itong magbago ayon sa mga pinakabagong teknolohiya.
Iyon ang dahilan kung bakit gumastos ang Amazon Web Services ng $100 milyon sa Generative AI Innovation Center nito. Sa kabila ng pangalan nito, ito ay isang “programa,” hindi isang pisikal na pasilidad.
Isang nakaraang Tech post ang nagbahagi ng paliwanag ni Sri Elaprolu ng pinuno ng programa sa proyektong ito. “Una, nakikipagtulungan kami sa mga customer upang matukoy ang mga pagkakataon sa negosyo at ang mga potensyal na generative na kaso ng paggamit ng AI,” sabi niya.
“Pagkatapos, tinutulungan sila ng aming koponan na magplano at bumuo ng mga patunay-ng-konsepto, at panghuli, tinutulungan namin silang maghanda para sa paglulunsad ng produksyon sa sukat,” dagdag ni Elaprolu. Gayundin, sinabi ng press release ng Amazon na mag-aalok ito ng mga libreng kurso:
โSa pamamagitan ng walang bayad na mga workshop, pakikipag-ugnayan, at pagsasanay, tutulungan ng AWS ang mga customer na isipin at saklawin ang mga kaso ng paggamit na lilikha ng pinakamalaking halaga para sa kanilang mga negosyo, batay sa pinakamahuhusay na kasanayan at kadalubhasaan sa industriya.”
Ang programa ay magbibigay-daan sa mga customer na gumamit ng AWS generative AI services na CodeWhisperer at Bedrock. Ang una ay isang tool sa programming na pinapagana ng AI.
BASAHIN: Paano kanselahin ang mga membership sa Amazon
Ipinaliwanag ng nakaraang nilalaman ng Inquirer Tech kung paano gumagana ang serbisyo ng cloud ng Bedrock AI. Una, ito ay magiging isang simpleng paraan upang mahanap at ma-access ang mga high-performance foundational models (FMs).
Bilang resulta, makakagawa sila ng mas maraming gawain kaysa sa iba pang mga modelo ng AI. Ang bagong platform ng Amazon ay magbibigay-daan sa mga kliyente na isama ang mga FM sa kanilang mga system.
Pangalawa, babawasan nito ang oras at pera na kailangan para mapanatili ang imprastraktura ng AI. Sa partikular, makakatulong ito sa mga customer na mahanap ang FM na angkop para sa kanilang mga pangangailangan at i-deploy ang mga ito nang mabilis. Pangatlo, maaaring ayusin ng mga kliyente ang mga FM sa kanilang data at isama ang mga ito sa iba pang mga tool.