Ce se întâmplă când restricționăm datele de antrenare ale AI

Inteligența artificială a ajuns să poată părea, în anumite contexte, ca un vizitator neobișnuit al epocilor trecute. În timp ce modelele moderne de limbaj mari (LLM) sunt frecvent percepute ca unelte pentru generarea de texte coerente și informative, un experiment recent demonstrează că acestea pot fi îmbrăcate în hainele vremurilor de altă dată, chiar și cele ale secolului al XIX-lea. Este vorba despre un proiect numit TimeCapsuleLLM, realizat de un student din Pennsylvania, Hayk Grigorian, care a antrenat un model exclusiv pe texte din Londra între 1800 și 1875. Rezultatul? Un AI „vorbitor” ca și cum ar fi trăit în epoca victoriană, capabil să răspundă în limbaj și cu referințe specifice acelei perioade.

### Începutul unui experiment istoric cu inteligența artificială

Crearea lui TimeCapsuleLLM a fost, în esență, o alegere conștientă de a limita ansamblul de date pentru a vedea ce rezultate ar putea apărea dacă un model AI s-ar „întoarce în timp” și ar absorbi doar informații dintr-un anumit interval istoric. Antrenat pe aproximativ 90 de gigabytes de documente, modelul deține potențialul de a vorbește despre evenimente sau personalități ale secolului al XIX-lea folosind terminologie și referințe care variază de la proteste sociale din Londra la politicieni precum Lord Palmerston. Problemele apar însă din modul în care modelul răspunde: textele generate nu sunt întotdeauna coerente, iar înțelesul profund rămâne uneori dificil de atins. În ciuda acestor limite, experimentul arată clar că restrângerea intenționată a datelor poate produce rezultate surprinzător de autentice din punct de vedere istoric.

### Studii despre trecutul psihologic al societăților

Această abordare nu este doar o curiozitate tehnică, ci și o perspectivă promițătoare pentru cercetarea istoriei sociale. Unele teorii recente sugerează utilizarea modelelor lingvistice mari specializate în contexte istorice, numite de cercetători „Historical Large Language Models” (HLLMs). Acestea ar putea, în teorie, ajuta la studierea psihologiei și comportamentului societăților din trecut, oferind o înțelegere mai profundă a normelor și valorilor dominante ale epocilor, fie că vorbim de lumea romană antică, Europa medievală sau civilizații din Asia de Est. La prima vedere, această idee aduce un avantaj major: posibilitatea de a compara tendințe precum cooperarea economică, atitudinile față de autoritate sau rolurile de gen, pe parcursul mai multor perioade istorice.

Însă, cercetătorii avertizează asupra unor limite fundamentale. În primul rând, textele din trecut, chiar dacă sunt valoroase, reprezintă doar o parte din realitate. Majoritatea sunt scrise de elite, de politicieni, clerici sau intelectuali, ceea ce înseamnă că vocea ziariștilor, a oamenilor obișnuiți sau a grupurilor marginalizate este adesea absentă. În plus, nu este ignorat impactul profuniei influențe a ideologiei și valorilor creatorilor modelelor de inteligență artificială, care tind să reflecte preferințele și biasurile acestora.

### Provocări și perspective asupra viitorului

Rezultatele acestor experimente sunt, pentru moment, mai mult o demonstrație a potențialului tehnologiei decât o soluție pentru cercetarea riguroasă a istoriei. Cu toate acestea, ele evidențiază cât de mult depinde AI-ul de contextul informațional în care este antrenat și cât de fragilă este, uneori, acuratețea interpretărilor. Suntem încă departe de a putea folosi aceste modele ca instrumente definitive în studiile istorice, dar ele pot oferi noi perspective pentru înțelegera profundă a societăților trecute.

Dezvoltările recente sugerează că, în următorii ani, vom vedea apariția unor astfel de modele specializate, capabile nu doar să genereze texte, ci și să simuleze mentalități și norme culturale ale epocilor de altădată. În același timp, rămâne clar că orice analiză bazată pe astfel de inteligențe artificiale trebuie privită cu respect pentru limitele și părtinirile inerente. În viitor, potențialul acestor tehnologii poate fi valorificat pentru înțelegeri mai nuanțate ale istoriei, dar și pentru a evidenția fragilitatea percepției noastre asupra trecutului și asupra informației în general.

Bogdan Dragomir

Autor

Lasa un comentariu