Conservarea digitală a patrimoniului umanității și
rolul cărții online
Dan Cristea
Partea 1: De ce păstrăm datele textuale în digital?
Modă sau necesitate?
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Real sau virtual?
• Suntem inundați de informații
– Percepția senzorială: auz, văz, miros, tac1l, gust
– În natură: sunete, imagini, parfumuri, a1ngeri, gusturi
• Tehnicile de realitate virtuală
– Care dintre senzații sunt perfect reproduc1bile și care doar palid?
– Putem reproduce societatea prin tehnici digitale?
– Putem reconstrui trecutul?
– Dorim să lăsăm posterității senzațiile pe care le trăim noi acum când pășim pe stradă, când ne întâlnim cu prieteni, când ieșim în natură?
Digital? Pentru ce?
• Reproducem în digital pentru că realul e atât de prețios și nu vrem să-l pierdem, nu pentru că
surogatul digital ar fi de mai mare valoare decât realul…
• La polul maxim al suspiciunilor: are reconstrucția digitală valoare culturală?
– E lipsită de materialitate!
– Nu e cumva un kitch?
– Am vrea să populăm un muzeu de artă cu reproduceri ale tablourilor, în lipsa originalelor?
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Ce sunt obiectele digitale?
• Texte, sunete, imagini 2D și 3D, filme,
animații 3D (reconstrucții), inclusiv produse instantaneu prin rularea unor programe
• Dar mai ales: combinații complexe între ele
Datele textuale pe Web
Aprox. 2,7 zetabytes de date există astăzi online 1 ZB = 10007bytes = 1021bytes
4%
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Text:
digital versus clasic
• Avantaje
– poate fi dată unui public mult mai larg – spațiu de depozitare mic
– mult mai ușor de căutat și de accesat
– poate fi folosită ușor pentru a crea noi valori, artefacte digitale
– în principiu, nedegradabilă
Digital versus clasic
• Dezavantaje
– dificultăți enorme în păstrarea pe termen lung – reînnoirea permanentă a so\ului de stocare și acces – pe măsură ce infrastructura se schimbă
• sisteme scalabile
• compa1bile diferitelor 1puri de obiecte digitale
– necesită un personal IT de specialitate calificat – “randament mai mic în studiu”
– “sa1sfacție redusă în lectură”
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Ins1tuțiile memoriei
• Păstrătoare ale patrimoniului societății
– Responsabile pentru captarea și conservarea de
“eșan1oane reprezenta1ve ale societății”
• Anne^e Balle Sorensen, Filip Kruse: Preserva'on Planning:
User Requirements for Digitally Preserved Materials, in Ercim News, Jan. 2010
– Muzeele și arhivele: responsabile de conservarea originalelor
– Bibliotecile: responsabile de păstrarea cópiilor (deși cărțile de patrimoniu sunt păstrate acolo ȘI în
original)
Partea a 2-a: Un parcurs tehnologic
Ce se mai întâmplă în lume în domeniul conservării patrimoniului spiritual?
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Tehnologia conservării digitale
• Infrastructura conținutului digital
– preluarea – stocarea – accesul
– prelucrarea
– securitatea datelor
Tehnologia conservării digitale
• Conservarea de lungă durată
– asigurarea accesului la obiectele digitale pe perioade extrem de lungi (decenii, secole)
• nu atât perimarea fizică a suporturilor…
• cât perimarea lor morală
• infrastructura se modernizează într-un ritm din ce în ce mai accelerat => incompa1bilități hardware și so\ware
– accesul la informație
– rularea aplicațiilor suport
– interfețe u1lizator care nu mai pot “ci1” vechile formate
– necesitatea de a concepe sisteme specializate de conservare => eforturi de cercetare finanțate de UE
• suporturi pentru back-up (renașterea benzilor magne1ce…)
Aspecte legale (drepturi de autor)
• Dreptul de a stoca resursele
• De a le difuza/reproduce (cui și sub ce licențe?)
• De a le exploata (în folos didac1c, al cercetării, comercial)
• Open Data?
• V. proiecte gen Google Books
Cine u1lizează conținutul digital
• Ins1tuțiile memoriei
– facilitând accesul publicului
• Ins1tutele de cercetare ș1ințifică, universitățile
– studierea trecutului și a… viitorului (pa^ernuri) – elaborarea de modele
• Antreprenori comerciali, industriali
– ca deținătoare a infrastructurii de achiziție și prelucrare – dezvoltatoare de aplicații și servicii bazate pe conținut – exploatarea comercială în conexiune cu piața
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Exploatarea comercială
• Procesarea informațiilor => lanțul cunoaștere- valoare => economie a cunoașterii
• Agenți economici (inclusiv cercetare industrială): depind de resurse digitale
• Zona Big Data: extrem de ofensivă…
Exemplu de infrastructură de conservare digitală
• PROTAGE – PReserva'on Organiza'on using Tools in AGent Environments (proiect de
cercetare FP7)
– agenți so\ware inteligenți și servicii Web pentru conservare digitală
– monitorirează procesul de conservare digitală
– automa1zează transferul de obiecte digitale între depozite digitale
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
PROTAGE
• Permite creatorilor de conținut digital să producă și să publice obiecte digitale într-o manieră compa1bilă conservării pe perioade îndelungate de 1mp
• Facilitează interoperabilitatea dintre creatorii de conținut digital (biblioteci și arhive) și
consumatori
• Oferă mijloace de automa1zare a proceselor
de conservare
Rețeaua DARIAH
• Interesată de date ș1ințifice u1lizate în ș1ințele umaniste
• Crearea unei infrastructuri solide care să asigure stabilitatea de lungă durată a valorilor digitale
– aspecte de natură tehnică, sociologică etc.
• Standarde, bune prac1ci
– Text Encoding Ini1a1ve (TEI)
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
DARIAH
• “ Surogate digitale ” :
– rezumări/transformări ale formatelor originare:
metadate, imagini scanate ale documentelor,
fotografii digitale, transcrieri ale surselor textuale, analize spectrale ale înregistrărilor vocale
– referințe pentru cercetare în lipsa originalelor ori completându-le
– u1lizate ca surse pentru crearea de noi surogate
Google Books
Library project
(h^p://www.google.com/googlebooks/library/):
– 130 milioane de 1tluri dis1ncte
• 480 de limbi
• 20% în domeniul public
• 10-15% in print
• restul: out of print
– 25 milioane cărți scanate (oct. 2015) – lucrează cu 40 de mari biblioteci
“ our goal is to improve access to books – not to replace them ”
Teleconferința interna1onală a 1nerilor cercetători“Crearea Societății Conș1inței” – 22-23 apr. 2016
Alte proiecte
• Europeana – bibliotecă digitală europeană
– iniția1va EU (2005): Jacques Chirac & alți președinți – contribuie 2000 ins1tuții
– în 2010: +10 ml obiecte digitale (h^p://www.europeana.eu/portal/)
• Gutenberg – efort colec1v voluntar de a digi1za și stoca opere de cultură (degrevate de drepturi de autor) în format digital
– Autor: Michael Hart
– oct. 2015: 50.000 obiecte digitale
Acțiunea COST e-Read
• Multe speculații asupra implicațiilor digi1zării asupra cogniției: probe empirice care indică impactul nega1v emoțional și cogni1v al ci1rii de pe ecran.
• E-Read încearcă să explice pe temeiuri ș1ințifice
implicațiile digi1zării în lectură, pentru a ajuta persoanele (societatea Europeană) să facă față op1m efectelor.
• Folosește modele mul1dimensionale, integra1ve are lecturii, combină paradigme din ș1ințele experimentale cu perspec1ve din ș1ințele umaniste (e.g., diacronică) =>
dezvoltă noi paradigme de cercetare și metrici pentru evaluarea impactului digi1zării asupra actului lecturii.
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Partea a 3-a: Cartea online
Dincolo de deliciile lecturii
Kindle
• Adecvat contextelor de lectură precare (vacanță, călătorie)
– “încarc în Kindle doar cărți ușoare, memorialis1că, polițiste…” => nu predispune reflecțiilor
– “nu mi-am făcut niciodată note…”
– “cărțile mari trebuie ci1te de pe hâr1e…”
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Ce e cartea online?
• Google:
– 234.000 de rezultate în căutarea expresiei “car1 online”
– 6.500.000 rezultate pentru “online books”
• În principal: portaluri de unde pot descărca gratuit cărți digitale?
• Există și o altă dimensiune…
MappingBooks:
evadează din carte în lumea virtuală și… reală!
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Ideea
• În prezent: fiecare carte – atâția ci1tori…
• MappingBooks: Cumpăr o carte… Incredibil! A
fost scrisă special pentru mine!
Ce ar fi să pot ieși afară din carte…
10/3/13 8:13 PM Katip Çelebi Mh., Maç Sk, Beyoğlu, Turkey to Çukur Cuma Cd, Beyoğlu, Turkey - Google Maps
Page 1 of 2 https://maps.google.com/maps?f=d&source=s_d&saddr=Maç+Sokak,+I…,288.55,2.369,37.281,0&layer=c&ei=OqVNUp3mE8nTtAaWr4CgCQ&pw=2
Directions to Çukur Cuma Cd, Beyo!lu, Turkey 400 m – about 4 mins
Walking directions are in beta.
Use caution – This route may be missing sidewalks or pedestrian paths.
Katip Çelebi Mh., Maç Sk, Beyo!lu, Turkey"
1. Head southwest on Maç Sk toward Baltacı Çk
About 47 secs go 75 m
total 75 m
2. Turn right onto Turnacıba"ı Cd go 28 m
total 100 m
3. Turn left onto A!a Külhanı Sk (Altıpatlar Sk.) About 2 mins
go 130 m total 240 m
4. Continue onto Çukur Cuma Cd
About 1 min go 150 m
total 400 m
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
MappingBooKs: către… cărțile vii
• Construcții mul1dimensionale care combină date de natură textuală, geografică, temporală
• Pune în evidență mențiunile de persoane, locații…
• U1lizează tehnici de legare a en1tăților (
en'tylinking
)
– conectează mențiuni din carte în lumea virtuală
• Legături sensibile la:
– contextul mențiunii din carte – locația curentă a ci1torului – momentul lecturii
Exemple de u1lizare
- Vizitez un oraș cu un ghid de călătorie în mână...
- locurile de interes, traseele, sunt re-ordonate în funcție de poziția mea
- Sunt elev și călătoresc cu trenul de la Sibiu la Bucureș1…
- dacă îmi deschid tableta și o îndrept spre fereastra din dreapta, voi vedea semnalate vârfurile munților Făgăraș, exact ca în manualul de Geografie
- Sunt în Paris pentru a 3-a oară…
- dar numai acum ghidul meu MB Lonely Planet îmi semnalează această expoziție deschisă în Piramidă
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
Aplicația
1) conectează mențiuni ale en1tăților (grupuri nominale) => fiecărei en1tăți îi corespunde un lanț coreferențial;
2) Baza de cunoș1nțe nu conține niciun fel de înregistrări despre en1tăți => ea se dezvoltă plecând de la zero;
3) Iden1fică relații geografice (poziții reciproce, distanțe, apropiere, intersecții etc.);
4) Textele inves1gate: manuale de Geografie și ghiduri de călătorie
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016
MappingBooks se adresează…
• Tinerilor, elevilor – îi putem oare recâș1ga ca ci1tori?...
• Adolescenților, aventurierilor, călătorilor, iubitorilor de excursii – socializare asupra locurilor amin1te în ghiduri
• Pensionarilor – relaționare asupra lecturilor comune, preferințelor culturale
• Cercetătorilor în Tehnologia limbajului & Lingvis1că computațională – acces la resurse lingvis1ce adnotate
• Deținătorilor de date textuale (edituri, companii media, ziare) – pentru a-și vinde mai bine produsele
• Administrația locală, agențiilor turis1ce – popularizarea locațiilor de interes local sau turis1c
MappingBooks: mulțumiri
• Studenților de la Fac. Informa1că – proto1p, ca proiect de semestru la cursul de IA, 2013-2014
• Ministerului Educației și Cercetării, pentru grant:
iulie 2014 – decembrie 2017
• Colegilor mei: Ionuț Pistol, Daniela Gîfu, Daniel Anechitei (Fac. Informa1că), Mihai Niculiță (Fac.
Geografie)
• Partenerilor din proiect: Univ. “ Ștefan cel Mare ” Suceava, SIVECO – Bucureș1
Teleconferința interna1onală a 1nerilor cercetători
“Crearea Societății Conș1inței” – 22-23 apr. 2016