Ang mga makina ng pagtuturo sa paraan na hinuhubog ng mga tagapagsanay ng hayop ang pag -uugali ng mga aso o kabayo ay isang mahalagang pamamaraan para sa pagbuo ng artipisyal na katalinuhan (AI) at isa na kinikilala noong Miyerkules kasama ang nangungunang computer science award.
Dalawang payunir sa larangan ng pag -aaral ng pampalakas, sina Andrew Barto at Richard Sutton, ay ang mga nagwagi ng AM Turing Award sa taong ito, ang katumbas ng tech na mundo ng Nobel Prize.
Pananaliksik na ang Barto, 76, at Sutton, 67, ay nagsimula noong huling bahagi ng 1970s ay naghanda ng daan para sa ilan sa mga nakaraang mga tagumpay sa AI ng nakaraang dekada. Sa gitna ng kanilang trabaho ay ang paglalagay ng tinatawag na hedonistic machine na maaaring patuloy na iakma ang kanilang pag-uugali bilang tugon sa mga positibong signal.
Patuloy ang artikulo pagkatapos ng patalastas na ito
Ang Pag -aaral ng Pagpapatibay ay kung ano ang humantong sa isang programa sa computer ng Google upang talunin ang pinakamahusay na mga manlalaro ng tao sa mga sinaunang laro ng board ng Tsino na pumunta sa 2016 at 2017. Ito rin ay naging isang pangunahing pamamaraan sa pagpapabuti ng mga tanyag na tool ng AI tulad ng Chatgpt, na -optimize ang pangangalakal sa pananalapi at pagtulong sa isang robotic na kamay na malutas ang isang Rubik’s Cube.
Ngunit sinabi ni Barto na ang patlang ay “hindi sunod sa moda” nang siya at ang kanyang mag -aaral na doktor, si Sutton, ay nagsimulang gumawa ng kanilang mga teorya at algorithm sa University of Massachusetts, Amherst.
“Kami ay uri ng sa ilang,” sinabi ni Barto sa isang pakikipanayam sa The Associated Press (AP). “Alin ang dahilan kung bakit napakasaya nitong matanggap ang award na ito, upang makita ito na maging mas kinikilala bilang isang bagay na may kaugnayan at kawili -wili. Sa mga unang araw, hindi. “
Patuloy ang artikulo pagkatapos ng patalastas na ito
Sinusuportahan ng Google ang taunang $ 1-milyong premyo, na inihayag noong Miyerkules ng Association for Computing Makinarya.
Mga ideya na hiniram
Ang Barto, na ngayon ay nagretiro mula sa University of Massachusetts, at Sutton, isang matagal na propesor sa University of Alberta ng Canada, ay hindi ang unang mga pioneer ng AI na nanalo ng award na pinangalanan pagkatapos ng British Mathematician, Codebreaker at Maagang AI Thinker Alan Turing. Ngunit ang kanilang pananaliksik ay direktang hinahangad na sagutin ang tawag ni Turing noong 1947 para sa isang makina na “maaaring malaman mula sa karanasan” – na inilarawan ni Sutton bilang “arguably ang mahahalagang ideya ng pag -aaral ng pampalakas.”
Sa partikular, humiram sila mula sa mga ideya sa sikolohiya at neuroscience tungkol sa paraan ng pagtugon sa mga neuron na naghahanap ng kasiyahan sa mga gantimpala o parusa.
Sa isang landmark paper na inilathala noong unang bahagi ng 1980s, itinakda ng Barto at Sutton ang kanilang bagong diskarte sa isang tiyak na gawain sa isang simulated na mundo: balansehin ang isang poste sa isang gumagalaw na cart upang mapanatili itong bumagsak. Ang dalawang computer na siyentipiko ay kalaunan ay coauthored isang malawak na ginamit na aklat -aralin sa pag -aaral ng pampalakas.
“Ang mga tool na binuo nila ay nananatiling isang sentral na haligi ng AI boom at nagbigay ng mga pangunahing pagsulong, naakit ang mga legion ng mga batang mananaliksik, at hinimok ang bilyun -bilyong dolyar sa pamumuhunan,” sabi ng punong siyentipiko ng Google na si Jeff Dean sa isang nakasulat na pahayag.
Magkakaibang pananaw
Sa isang magkasanib na pakikipanayam sa AP, ang Barto at Sutton ay hindi palaging sumasang -ayon sa kung paano suriin ang mga panganib ng mga ahente ng AI na patuloy na naghahangad na mapagbuti ang kanilang sarili.
Nakilala din nila ang kanilang gawain mula sa sangay ng teknolohiyang Generative AI na kasalukuyang nasa fashion – ang mga malalaking modelo ng wika sa likod ng mga chatbots na ginawa ng OpenAI, Google at iba pang mga higanteng tech na gayahin ang pagsulat ng tao at iba pang media.
“Ang malaking pagpipilian ay, sinubukan mo bang malaman mula sa data ng mga tao, o sinusubukan mong malaman mula sa sariling buhay ng ahente ng (AI)? Sabi ni Sutton.
Tinanggal ni Sutton kung ano ang inilarawan niya bilang labis na pag -aalala tungkol sa banta ni AI sa sangkatauhan, habang hindi sumasang -ayon si Barto at sinabing “Kailangan mong makilala ang mga potensyal na hindi inaasahang bunga.”
Si Barto, na nagretiro sa loob ng 14 na taon, ay naglalarawan sa kanyang sarili bilang isang Luddite, habang si Sutton ay yumakap sa isang hinaharap na inaasahan niyang magkaroon ng mga nilalang ng higit na katalinuhan kaysa sa kasalukuyang mga tao – isang ideya na minsan na kilala bilang posthumanism.