Ito ay nabuo ng AI na nagbubuod, na maaaring magkaroon ng mga pagkakamali. Para sa konteksto, palaging sumangguni sa buong artikulo.
Sinabi ni Cloudflare na kapag ang mga crawler ng Perplexity ay ipinakita sa isang bloke ng network, lumilitaw silang nakakubli
MANILA, Philippines – Sinabi ng Internet Infrastructure Provider CloudFlare na ang artipisyal na kumpanya ng intelihensiya ay ang pag -aalsa ng mga patakaran na inilaan upang maiwasan ang mga crawler nito – ang mga programa na nagtitipon ng data mula sa mga site sa web – mula sa pag -scrap ng mga website ng kanilang data.
Sa isang post sa blog noong Lunes, Agosto 4, sinabi ni Cloudflare na kapag ang mga crawler ng Perplexity ay ipinakita sa isang bloke ng network, “lumilitaw silang nakatago ng kanilang pag -crawl ng pagkakakilanlan sa isang pagtatangka upang maiiwasan ang mga kagustuhan ng website” na hindi na -crawl para sa data.
Idinagdag ni CloudFlare na may patuloy na pagkawasak ng katibayan ay nagbabago ng mga bot nito upang “itago ang kanilang aktibidad sa pag -crawl, pati na rin ang hindi papansin – o kung minsan ay hindi pagtupad kahit na kumuha – mga file ng robots.txt.”
Ang mga file ng Robots.txt ay mga file na inilaan upang ipahiwatig kung pinapayagan ang isang crawler na mag -scrape ng ilang mga uri ng data. Ang mga file na ito ay maaari ring lumikha ng maiwasan ang ilang mga uri ng mga bot ng crawler mula sa pag -access sa isang website o pagbabasa ng mga nilalaman nito.
Sinabi ni CloudFlare na sinubukan nila ito sa pamamagitan ng paggawa ng mga site ng pagsubok na may “isang robots.txt file na may mga direktiba upang ihinto ang anumang magalang na mga bot mula sa pag -access sa anumang bahagi ng isang website.” Ang eksperimento ay nagtanong sa kanila ng nalilito AI para sa impormasyon sa mga site ng pagsubok, at ang pagkalugi ay nagbigay pa rin ng detalyadong impormasyon sa nilalaman na naka -host sa mga pinigilan na mga domain.
“Ang tugon na ito ay hindi inaasahan, dahil kinuha namin ang lahat ng kinakailangang pag -iingat upang maiwasan ang data na ito na makuha ng kanilang mga crawler,” sabi ni Cloudflare.
Ang nakatago, o hindi natukoy, ang Crawler ay nagpatuloy sa pag -access ng mga website para sa pag -scrape ng nilalaman sa kabila ng mga patakaran na inilagay ng mga site na ito laban sa pagiging gumapang. “Ang aktibidad na ito ay sinusunod sa libu -libong mga domain at milyun -milyong mga kahilingan bawat araw. Nagawa naming fingerprint ang crawler na ito gamit ang isang kumbinasyon ng mga pag -aaral ng makina at mga signal ng network,” sabi ni Cloudflare.
Nakikipag -usap sa TechCrunch, ang tagapagsalita ng Perplexity na si Jesse Dwyer ay tinanggal ang post sa blog ni Cloudflare bilang isang “sales pitch,” at sinabi ang mga screenshot sa post na “Ipakita na walang nilalaman na na -access.” Ang isang follow-up na email mula kay Dwyer ay inaangkin ang bot na pinangalanan sa blog ng Cloudflare na “ay hindi rin sa atin.”
Ang CloudFlare ay kinuha sa publiko na nakatayo laban sa pag-crawl ng AI, kasama nito ang pag-anunsyo ng isang pay-per-crawl system noong Hulyo na maaaring samantalahin ng mga gumagamit nito upang hadlangan ang mga bot ng data o singilin ang mga ito upang ma-access ang nilalaman ng isang site. – Rappler.com

