Un site de comerţ electronic a picat din cauza modului în care funcţionează botul folosit de OpenAI pentru strângerea informaţiilor pe baza cărora este antrenat ChatGPT.
În week-end, magazinul online Triplegangers a devenit inaccesibil. După o investigaţie internă, administratorii au găsit vinovatul - botul care copiază date de pe mai toate site-urile de pe internet al OpenAI.
Inginerii au reuşit să numere peste 600 de IP-uri pe care botul producătorului ChatGPT le-a folosit pentru a copia rapid informaţiile.
„Botul lor pur şi simplu ne-a zdrobit serverul. A fost la fel ca la un atac DDoS” spune CEO-ul de la Triplegangers Oleksandr Tomchuk.
Dincolo de inconvenientul de a avea magazinul închis pentru o perioadă de timp, Triplegangers a trebuit să plătească şi o factură semnificativ mai mare către Amazon, care-i furnizează infrastructura web.
Una dintre lecţiile care pot fi învăţare de aici de orice site online este importanţa introducerii în robots.txt a restricţiilor pentru boţii companiilor de AI.
Este adevărat că nu toate companiile de AI respectă aceste restricţii. OpenAI şi alte mari companii spun că le onorează, însă, altele, precum Perplexity, au fost prinse că procesează datele indiferent de parametrii trecuţi în robots.txt de site-urile online.