Ang ideya ng isang tulad ng artipisyal na katulong na katulong na maaari mong makipag-usap ay nabuhay sa maraming mga haka-haka ng mga tao mula nang mailabas ang “Her,” 2013 na pelikula ni Spike Jonze tungkol sa isang tao na umibig sa isang Siri-tulad ng AI na nagngangalang Samantha. Sa paglipas ng pelikula, ang protagonist ay nakikipag -ugnay sa mga paraan kung saan si Samantha, tunay na tila siya ay tila, ay hindi at hindi magiging tao.
Labindalawang taon na, hindi na ito ang mga bagay -bagay ng science fiction. Ang mga tool na Generative AI tulad ng Chatgpt at mga digital na katulong tulad ng Apple’s Siri at Amazon’s Alexa ay tumutulong sa mga tao na makakuha ng mga direksyon sa pagmamaneho, gumawa ng mga listahan ng grocery, at marami pa. Ngunit tulad ni Samantha, ang mga awtomatikong sistema ng pagkilala sa pagsasalita ay hindi pa rin magagawa ang lahat na magagawa ng isang nakikinig ng tao.
Marahil ay nagkaroon ka ng nakakabigo na karanasan sa pagtawag sa iyong bangko o kumpanya ng utility at kailangang ulitin ang iyong sarili upang ang bot ng serbisyo ng digital na customer sa kabilang linya ay maiintindihan ka. Marahil ay nagdidikta ka ng isang tala sa iyong telepono, lamang na gumugol ng oras sa pag -edit ng mga garbled na salita.
Ang mga mananaliksik sa Linguistic at Computer Science ay nagpakita na ang mga sistemang ito ay mas masahol para sa ilang mga tao kaysa sa iba. May posibilidad silang gumawa ng mas maraming mga pagkakamali kung mayroon kang isang hindi katutubo o isang rehiyonal na tuldik, itim, magsalita sa African American vernacular English, code-switch, kung ikaw ay isang babae, matanda, ay masyadong bata o may impediment sa pagsasalita.
Tainga ng lata
Hindi tulad mo o sa akin, ang mga awtomatikong sistema ng pagkilala sa pagsasalita ay hindi ang tinatawag ng mga mananaliksik na “nakikiramay na tagapakinig.” Sa halip na subukang maunawaan ka sa pamamagitan ng pagkuha ng iba pang kapaki -pakinabang na mga pahiwatig tulad ng intonasyon o mga kilos sa mukha, sumuko lamang sila. O kumukuha sila ng isang probabilistic na hula, isang paglipat na kung minsan ay maaaring magresulta sa isang error.
Habang ang mga kumpanya at pampublikong ahensya ay lalong nagpatibay ng mga awtomatikong tool sa pagkilala sa pagsasalita upang maputol ang mga gastos, ang mga tao ay may kaunting pagpipilian ngunit makihalubilo sa kanila. Ngunit ang higit pa na ginagamit ng mga sistemang ito sa mga kritikal na larangan, mula sa emergency na unang sumasagot at pangangalaga sa kalusugan sa edukasyon at pagpapatupad ng batas, mas malamang na magkakaroon ng malubhang kahihinatnan kapag hindi nila kinikilala ang sinasabi ng mga tao.
Isipin minsan sa malapit na hinaharap nasaktan ka sa isang pag -crash ng kotse. Nag -dial ka ng 911 upang tumawag para sa tulong, ngunit sa halip na konektado sa isang dispatcher ng tao, nakakakuha ka ng isang bot na idinisenyo upang magbunot ng mga tawag na hindi pang -akit. Dadalhin ka ng ilang mga pag -ikot upang maunawaan, pag -aaksaya ng oras at itaas ang antas ng iyong pagkabalisa sa pinakamasamang sandali.
Ano ang nagiging sanhi ng ganitong uri ng error? Ang ilan sa mga hindi pagkakapantay -pantay na nagreresulta mula sa mga sistemang ito ay inihurnong sa mga reams ng data ng lingguwistika na ginagamit ng mga developer upang makabuo ng mga malalaking modelo ng wika. Sinasanay ng mga developer ang mga artipisyal na sistema ng katalinuhan upang maunawaan at gayahin ang wika ng tao sa pamamagitan ng pagpapakain sa kanila ng maraming dami ng teksto at audio file na naglalaman ng tunay na pagsasalita ng tao. Ngunit kaninong pagsasalita ang pinapakain nila sa kanila?
Kung ang isang sistema ay nagmarka ng mataas na rate ng kawastuhan kapag nakikipag-usap sa mayaman na mga puting Amerikano sa kanilang kalagitnaan ng 30s, makatuwiran na hulaan na sinanay ito gamit ang maraming mga pag-record ng audio ng mga taong umaangkop sa profile na ito.
Sa mahigpit na koleksyon ng data mula sa isang magkakaibang hanay ng mga mapagkukunan, maaaring mabawasan ng mga developer ng AI ang mga pagkakamali na ito. Ngunit upang mabuo ang mga sistema ng AI na maaaring maunawaan ang walang katapusang mga pagkakaiba -iba sa pagsasalita ng tao na nagmula sa mga bagay tulad ng kasarian, edad, lahi, una kumpara sa pangalawang wika, katayuan sa socioeconomic, kakayahan at marami pa, ay nangangailangan ng mga makabuluhang mapagkukunan at oras.
‘Wastong’ English
Para sa mga taong hindi nagsasalita ng Ingles – na sasabihin, karamihan sa mga tao sa buong mundo – ang mga hamon ay mas malaki. Karamihan sa mga pinakamalaking generative AI system sa buong mundo ay itinayo sa Ingles, at mas mahusay silang nagtatrabaho sa Ingles kaysa sa anumang iba pang wika. Sa papel, ang AI ay may maraming potensyal na civic para sa pagsasalin at pagtaas ng pag -access ng mga tao sa impormasyon sa iba’t ibang wika, ngunit sa ngayon, ang karamihan sa mga wika ay may isang mas maliit na digital na bakas ng paa, na ginagawang mahirap para sa kanila na mag -kapangyarihan ng mga malalaking modelo ng wika.
Kahit na sa loob ng mga wika na mahusay na pinaglingkuran ng mga malalaking modelo ng wika, tulad ng Ingles at Espanyol, ang iyong karanasan ay nag-iiba depende sa kung aling dayalekto ng wika na iyong sinasalita.
Sa ngayon, ang karamihan sa mga sistema ng pagkilala sa pagsasalita at mga generative AI chatbots ay sumasalamin sa mga linggwistikong biases ng mga datasets na kanilang sinanay. Nag -echo sila ng prescriptive, kung minsan ay pinipigilan ang mga paniwala ng “kawastuhan” sa pagsasalita.
Sa katunayan, ang AI ay napatunayan na “mag -flatten” na pagkakaiba -iba ng lingguwistika. Mayroon na ngayong mga kumpanya ng pagsisimula ng AI na nag -aalok upang burahin ang mga accent ng kanilang mga gumagamit, na iginuhit sa pag -aakala na ang kanilang pangunahing kliyente ay magiging mga tagapagbigay ng serbisyo sa customer na may mga call center sa mga dayuhang bansa tulad ng India o Pilipinas. Ang alok ay nagpapatuloy sa paniwala na ang ilang mga accent ay hindi gaanong wasto kaysa sa iba.
Koneksyon ng tao
Ang AI ay maaaring makakuha ng mas mahusay sa pagproseso ng wika, accounting para sa mga variable tulad ng mga accent, code-switch at iba pa. Sa US, ang mga serbisyong pampubliko ay obligado sa ilalim ng pederal na batas upang masiguro ang pantay na pag -access sa mga serbisyo anuman ang wika na sinasalita ng isang tao. Ngunit hindi malinaw kung ang nag -iisa ay magiging sapat na insentibo para sa industriya ng tech na lumipat patungo sa pagtanggal ng mga hindi pagkakapantay -pantay sa lingguwistika.
Mas gusto ng maraming tao na makipag -usap sa isang tunay na tao kapag nagtatanong tungkol sa isang panukalang batas o medikal na isyu, o hindi bababa sa magkaroon ng kakayahang mag -opt out sa pakikipag -ugnay sa mga awtomatikong sistema kapag naghahanap ng mga pangunahing serbisyo. Iyon ay hindi upang sabihin na ang maling impormasyon ay hindi kailanman nangyayari sa interpersonal na komunikasyon, ngunit kapag nakikipag -usap ka sa isang tunay na tao, sila ay primed na maging isang nakikinig na nakikinig.
Sa AI, hindi bababa sa ngayon, gumagana ito o hindi. Kung maproseso ng system ang sinasabi mo, mahusay kang pumunta. Kung hindi ito, ang onus ay nasa iyo upang maunawaan ang iyong sarili.
Ang artikulong ito ay nai -publish mula sa pag -uusap, isang hindi pangkalakal, independiyenteng samahan ng balita na nagdadala sa iyo ng mga katotohanan at mapagkakatiwalaang pagsusuri upang matulungan kang magkaroon ng kahulugan ng aming kumplikadong mundo. Ito ay isinulat ni: Roberto Rey Agudo, Dartmouth College
Magbasa pa:
Si Roberto Rey Agudo ay hindi gumagana para sa, kumunsulta, sariling pagbabahagi o makatanggap ng pondo mula sa anumang kumpanya o samahan na makikinabang mula sa artikulong ito, at hindi nagsiwalat ng walang kaugnay na mga kaakibat na lampas sa kanilang appointment sa akademiko.