• Nu S-Au Găsit Rezultate

Partea 1: De ce păstrăm datele textuale în digital?

N/A
N/A
Protected

Academic year: 2022

Share "Partea 1: De ce păstrăm datele textuale în digital? "

Copied!
35
0
0

Text complet

(1)

Conservarea digitală a patrimoniului umanității și

rolul cărții online

Dan Cristea

(2)

Partea 1: De ce păstrăm datele textuale în digital?

Modă sau necesitate?

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(3)

Real sau virtual?

•  Suntem inundați de informații

–  Percepția senzorială: auz, văz, miros, tac1l, gust

–  În natură: sunete, imagini, parfumuri, a1ngeri, gusturi

•  Tehnicile de realitate virtuală

–  Care dintre senzații sunt perfect reproduc1bile și care doar palid?

–  Putem reproduce societatea prin tehnici digitale?

–  Putem reconstrui trecutul?

–  Dorim să lăsăm posterității senzațiile pe care le trăim noi acum când pășim pe stradă, când ne întâlnim cu prieteni, când ieșim în natură?

(4)

Digital? Pentru ce?

•  Reproducem în digital pentru că realul e atât de prețios și nu vrem să-l pierdem, nu pentru că

surogatul digital ar fi de mai mare valoare decât realul…

•  La polul maxim al suspiciunilor: are reconstrucția digitală valoare culturală?

–  E lipsită de materialitate!

–  Nu e cumva un kitch?

–  Am vrea să populăm un muzeu de artă cu reproduceri ale tablourilor, în lipsa originalelor?

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(5)

Ce sunt obiectele digitale?

•  Texte, sunete, imagini 2D și 3D, filme,

animații 3D (reconstrucții), inclusiv produse instantaneu prin rularea unor programe

•  Dar mai ales: combinații complexe între ele

(6)

Datele textuale pe Web

Aprox. 2,7 zetabytes de date există astăzi online 1 ZB = 10007bytes = 1021bytes

4%

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(7)

Text:

digital versus clasic

•  Avantaje

– poate fi dată unui public mult mai larg – spațiu de depozitare mic

– mult mai ușor de căutat și de accesat

– poate fi folosită ușor pentru a crea noi valori, artefacte digitale

– în principiu, nedegradabilă

(8)

Digital versus clasic

•  Dezavantaje

– dificultăți enorme în păstrarea pe termen lung – reînnoirea permanentă a so\ului de stocare și acces – pe măsură ce infrastructura se schimbă

•  sisteme scalabile

•  compa1bile diferitelor 1puri de obiecte digitale

– necesită un personal IT de specialitate calificat – “randament mai mic în studiu”

– “sa1sfacție redusă în lectură”

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(9)

Ins1tuțiile memoriei

•  Păstrătoare ale patrimoniului societății

– Responsabile pentru captarea și conservarea de

“eșan1oane reprezenta1ve ale societății”

•  Anne^e Balle Sorensen, Filip Kruse: Preserva'on Planning:

User Requirements for Digitally Preserved Materials, in Ercim News, Jan. 2010

– Muzeele și arhivele: responsabile de conservarea originalelor

– Bibliotecile: responsabile de păstrarea cópiilor (deși cărțile de patrimoniu sunt păstrate acolo ȘI în

original)

(10)

Partea a 2-a: Un parcurs tehnologic

Ce se mai întâmplă în lume în domeniul conservării patrimoniului spiritual?

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(11)

Tehnologia conservării digitale

•  Infrastructura conținutului digital

–  preluarea –  stocarea –  accesul

–  prelucrarea

–  securitatea datelor

(12)

Tehnologia conservării digitale

•  Conservarea de lungă durată

–  asigurarea accesului la obiectele digitale pe perioade extrem de lungi (decenii, secole)

•  nu atât perimarea fizică a suporturilor…

•  cât perimarea lor morală

•  infrastructura se modernizează într-un ritm din ce în ce mai accelerat => incompa1bilități hardware și so\ware

–  accesul la informație

–  rularea aplicațiilor suport

–  interfețe u1lizator care nu mai pot ci1 vechile formate

–  necesitatea de a concepe sisteme specializate de conservare => eforturi de cercetare finanțate de UE

•  suporturi pentru back-up (renașterea benzilor magne1ce…)

(13)

Aspecte legale (drepturi de autor)

•  Dreptul de a stoca resursele

•  De a le difuza/reproduce (cui și sub ce licențe?)

•  De a le exploata (în folos didac1c, al cercetării, comercial)

•  Open Data?

•  V. proiecte gen Google Books

(14)

Cine u1lizează conținutul digital

•  Ins1tuțiile memoriei

– facilitând accesul publicului

•  Ins1tutele de cercetare ș1ințifică, universitățile

– studierea trecutului și a… viitorului (pa^ernuri) – elaborarea de modele

•  Antreprenori comerciali, industriali

– ca deținătoare a infrastructurii de achiziție și prelucrare – dezvoltatoare de aplicații și servicii bazate pe conținut – exploatarea comercială în conexiune cu piața

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(15)

Exploatarea comercială

•  Procesarea informațiilor => lanțul cunoaștere- valoare => economie a cunoașterii

•  Agenți economici (inclusiv cercetare industrială): depind de resurse digitale

•  Zona Big Data: extrem de ofensivă…

(16)

Exemplu de infrastructură de conservare digitală

•  PROTAGE – PReserva'on Organiza'on using Tools in AGent Environments (proiect de

cercetare FP7)

– agenți so\ware inteligenți și servicii Web pentru conservare digitală

– monitorirează procesul de conservare digitală

– automa1zează transferul de obiecte digitale între depozite digitale

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(17)

PROTAGE

•  Permite creatorilor de conținut digital să producă și să publice obiecte digitale într-o manieră compa1bilă conservării pe perioade îndelungate de 1mp

•  Facilitează interoperabilitatea dintre creatorii de conținut digital (biblioteci și arhive) și

consumatori

•  Oferă mijloace de automa1zare a proceselor

de conservare

(18)

Rețeaua DARIAH

•  Interesată de date ș1ințifice u1lizate în ș1ințele umaniste

•  Crearea unei infrastructuri solide care să asigure stabilitatea de lungă durată a valorilor digitale

– aspecte de natură tehnică, sociologică etc.

•  Standarde, bune prac1ci

– Text Encoding Ini1a1ve (TEI)

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(19)

DARIAH

•  “ Surogate digitale ” :

– rezumări/transformări ale formatelor originare:

metadate, imagini scanate ale documentelor,

fotografii digitale, transcrieri ale surselor textuale, analize spectrale ale înregistrărilor vocale

– referințe pentru cercetare în lipsa originalelor ori completându-le

– u1lizate ca surse pentru crearea de noi surogate

(20)

Google Books

Library project

(h^p://www.google.com/googlebooks/library/):

– 130 milioane de 1tluri dis1ncte

•  480 de limbi

•  20% în domeniul public

•  10-15% in print

•  restul: out of print

– 25 milioane cărți scanate (oct. 2015) – lucrează cu 40 de mari biblioteci

“ our goal is to improve access to books – not to replace them ”

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(21)

Alte proiecte

•  Europeana – bibliotecă digitală europeană

– iniția1va EU (2005): Jacques Chirac & alți președinți – contribuie 2000 ins1tuții

– în 2010: +10 ml obiecte digitale (h^p://www.europeana.eu/portal/)

•  Gutenberg – efort colec1v voluntar de a digi1za și stoca opere de cultură (degrevate de drepturi de autor) în format digital

– Autor: Michael Hart

– oct. 2015: 50.000 obiecte digitale

(22)

Acțiunea COST e-Read

•  Multe speculații asupra implicațiilor digi1zării asupra cogniției: probe empirice care indică impactul nega1v emoțional și cogni1v al ci1rii de pe ecran.

•  E-Read încearcă să explice pe temeiuri ș1ințifice

implicațiile digi1zării în lectură, pentru a ajuta persoanele (societatea Europeană) să facă față op1m efectelor.

•  Folosește modele mul1dimensionale, integra1ve are lecturii, combină paradigme din ș1ințele experimentale cu perspec1ve din ș1ințele umaniste (e.g., diacronică) =>

dezvoltă noi paradigme de cercetare și metrici pentru evaluarea impactului digi1zării asupra actului lecturii.

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(23)

Partea a 3-a: Cartea online

Dincolo de deliciile lecturii

(24)

Kindle

•  Adecvat contextelor de lectură precare (vacanță, călătorie)

– “încarc în Kindle doar cărți ușoare, memorialis1că, polițiste…” => nu predispune reflecțiilor

– “nu mi-am făcut niciodată note…”

– “cărțile mari trebuie ci1te de pe hâr1e…”

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(25)

Ce e cartea online?

•  Google:

– 234.000 de rezultate în căutarea expresiei “car1 online”

– 6.500.000 rezultate pentru “online books”

•  În principal: portaluri de unde pot descărca gratuit cărți digitale?

•  Există și o altă dimensiune…

(26)

MappingBooks:

evadează din carte în lumea virtuală și… reală!

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(27)

Ideea

•  În prezent: fiecare carte – atâția ci1tori…

•  MappingBooks: Cumpăr o carte… Incredibil! A

fost scrisă special pentru mine!

(28)

Ce ar fi să pot ieși afară din carte…

10/3/13 8:13 PM Katip Çelebi Mh., Maç Sk, Beyoğlu, Turkey to Çukur Cuma Cd, Beyoğlu, Turkey - Google Maps

Page 1 of 2 https://maps.google.com/maps?f=d&source=s_d&saddr=Maç+Sokak,+I…,288.55,2.369,37.281,0&layer=c&ei=OqVNUp3mE8nTtAaWr4CgCQ&pw=2

Directions to Çukur Cuma Cd, Beyo!lu, Turkey 400 m – about 4 mins

Walking directions are in beta.

Use caution – This route may be missing sidewalks or pedestrian paths.

Katip Çelebi Mh., Maç Sk, Beyo!lu, Turkey"

1. Head southwest on Maç Sk toward Baltacı Çk

About 47 secs go 75 m

total 75 m

2. Turn right onto Turnacıba"ı Cd go 28 m

total 100 m

3. Turn left onto A!a Külhanı Sk (Altıpatlar Sk.) About 2 mins

go 130 m total 240 m

4. Continue onto Çukur Cuma Cd

About 1 min go 150 m

total 400 m

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(29)

MappingBooKs: către… cărțile vii

•  Construcții mul1dimensionale care combină date de natură textuală, geografică, temporală

•  Pune în evidență mențiunile de persoane, locații…

•  U1lizează tehnici de legare a en1tăților (

en'ty

linking

)

– conectează mențiuni din carte în lumea virtuală

•  Legături sensibile la:

– contextul mențiunii din carte – locația curentă a ci1torului – momentul lecturii

(30)

Exemple de u1lizare

-   Vizitez un oraș cu un ghid de călătorie în mână...

- locurile de interes, traseele, sunt re-ordonate în funcție de poziția mea

-   Sunt elev și călătoresc cu trenul de la Sibiu la Bucureș1…

- dacă îmi deschid tableta și o îndrept spre fereastra din dreapta, voi vedea semnalate vârfurile munților Făgăraș, exact ca în manualul de Geografie

-   Sunt în Paris pentru a 3-a oară…

- dar numai acum ghidul meu MB Lonely Planet îmi semnalează această expoziție deschisă în Piramidă

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(31)
(32)

Aplicația

1) conectează mențiuni ale en1tăților (grupuri nominale) => fiecărei en1tăți îi corespunde un lanț coreferențial;

2) Baza de cunoș1nțe nu conține niciun fel de înregistrări despre en1tăți => ea se dezvoltă plecând de la zero;

3) Iden1fică relații geografice (poziții reciproce, distanțe, apropiere, intersecții etc.);

4) Textele inves1gate: manuale de Geografie și ghiduri de călătorie

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(33)

MappingBooks se adresează…

•  Tinerilor, elevilor – îi putem oare recâș1ga ca ci1tori?...

•  Adolescenților, aventurierilor, călătorilor, iubitorilor de excursii – socializare asupra locurilor amin1te în ghiduri

•  Pensionarilor – relaționare asupra lecturilor comune, preferințelor culturale

Cercetătorilor în Tehnologia limbajului & Lingvis1că computațională – acces la resurse lingvis1ce adnotate

•  Deținătorilor de date textuale (edituri, companii media, ziare) – pentru a-și vinde mai bine produsele

Administrația locală, agențiilor turis1ce – popularizarea locațiilor de interes local sau turis1c

(34)

MappingBooks: mulțumiri

•  Studenților de la Fac. Informa1că – proto1p, ca proiect de semestru la cursul de IA, 2013-2014

•  Ministerului Educației și Cercetării, pentru grant:

iulie 2014 – decembrie 2017

•  Colegilor mei: Ionuț Pistol, Daniela Gîfu, Daniel Anechitei (Fac. Informa1că), Mihai Niculiță (Fac.

Geografie)

•  Partenerilor din proiect: Univ. “ Ștefan cel Mare ” Suceava, SIVECO – Bucureș1

Teleconferința interna1onală a 1nerilor cercetători

Crearea Societății Conș1inței – 22-23 apr. 2016

(35)

Iar dumneavoastră, vă mulțumesc pentru

bunăvoința de a mă asculta!

Referințe

DOCUMENTE SIMILARE

Rezultatul final a fost un set clar de criterii pentru ICD‑10 și pentru instrumentele de evaluare, care pot asigura datele necesare clasificării tulburărilor în funcție de

Se stabileşte calitatea modelului creat pe baza acestor ponderi pentru TOATE dintre datele de intrare. Se ajustează ponderile în funcţie de

 Schimbările de direcţie ale unei funcţii pot fi detectate cu ajutorul derivatei I  cele mai mari schimbări apar acolo unde derivata I are magnitudine (normă,

„bombardat” cu diverse tipuri de discurs. De la reclame la discursul politic, de la discursul bisericesc la cel monden, fiecare, în mod particular, urmăreşte

Aplicația poate constitui un punct de plecare pentru crearea altor programe în domeniul Computer Vision, inclusiv al unui program de desenare prin intermediul camerei web frontale a

 În cazul în care calculatorul nu “va vede” Arduino-ul, se poate ca o masură de siguranţă să fi intrat în acţiune (de fapt este o “siguranţă” automatizată – ce

În lucrare au fost prezentate: determinarea mărimilor caracteristice ale sistemului gleznă – picior, cu importanță în stabilirea diagnosticului, evaluarea

Rezumat: În prezenta teză de doctorat se prezintă concepte şi noţiuni fundamentale privind riscurile în ingineria civilă precum şi principalele surse de risc din acest