BLOG
mai multe imagini ...

30 de cetățeni pasionați, datele Guvernului și 30 de calculatoare

Autor: Andra Bucur 25 februarie 2014
Versiune pentru imprimantaSend by emailVersiune PDF

 

Sâmbătă, 22 februarie, de ziua internațională a datelor deschise, Coaliția pentru Date Deschise[1], cu sprijinul Departamentului de Servicii Online și Design din cadrul Cancelariei Primului-Ministru, a organizat primul Hackathon cu date deschise preluate de pe platforma www.data.gov.ro cu scopul de a transforma seturile de date guvernamentale în aplicații vizuale utile cetățenilor. 

În noiembrie anul trecut s-a lansat primul portal din România care conține seturi de date guvernamentale, disponibile în format deschis[2] și sub o licență liberă[3], www.data.gov.ro .

Aproximativ 30 de programatori și activiști și-au sacrificat sfârșitul de săptămână pentru a arăta ce se poate face cu datele deținute de guvern, atunci când sunt puse la dispoziție într-un format accesibil. După două zile de lucru intens, de dimineața până seara și învingând frustrările legate de calitatea datelor, rezultatele au fost incredibile.

 

  1. Au fost introduse în Wikipedia aproximativ 200 de monumente istorice și muzee. Imediat ce au fost introduse, utilizatori de internet pasionați au încărcat o poză a Muzeului Național al Hărții, unul din muzeele nou introduse. A fost sau nu o muncă ușoară? Dat fiind că în seturile guvernamentale de date toate muzeele de artă din țară sunt trecute cu aceeași denumire, fără localitatea aferentă sau alte elemente de identificare, a fost cu siguranță o provocare.
  2. Au fost culese date de pe site-ul Ministerului Educației și de pe site-uri ale unor instituții cu atribuții în domeniul educațional și s-a realizat o bază de date cu nota la examenul de capacitate, nota la examenul de bacalaureat și liceul urmat, date care pot sta la baza unor aplicații prin care se poate determina în ce măsură, dacă urmezi liceele așa-zise „bune”, se îmbunătățesc performanțele școlare de-a lungul anilor. O evidență care este cu adevărat importantă pentru școli și pentru părinți deopotrivă.
  3. Au fost curățate seturi de date și create filtre de căutare și vizualizări ale achizițiilor publice. Deși calitatea datelor guvernamentale privind achizițiile publice în România s-a îmbunătățit din 2007 până în prezent,  există erori grave. De exemplu, a reieșit din analiza datelor că o companie din Frecăței a făcut o achiziție de 3 miliarde de euro sau că o firmă din Antarctica ar fi câștigat o licitație. Toate aceste incoerențe și informații false, împiedică reutilizarea datelor și ridică problema corectitudinii datelor furnizate de agențiile guvernamentale.
  4. Achizițiile publice directe atribuite în 2013 au fost introduse într-o platformă, iar în urma analizei datelor, a rezultat topul câștigătorilor licitațiilor, utilizându-se drept criterii valoarea și numărul de achiziții. A reieșit că Selgros se află în topul câștigătorilor din punct de vedere al valorii achiziției. De asemenea, a reieșit că Direcția Generală de Asistență Socială din Ialomița  a avut peste 4400 de achiziții directe în anul 2013. Aplicația a fost realizată cu ajutorul platformei software de Business intelligence Tableau.
  5. A fost reprezentată pe hartă durata medie de viață în România și evoluția acesteia din 2 în doi ani, pentru fiecare regiune din țară, pentru perioada 1999 – 2001, precum și cauzele de deces și longevitatea defalcată pe sexe. Din reprezentările vizuale, rezultă că a crescut numărul de decese cauzat de tumori, dar că, în același timp, durata medie de viață a crescut. 
  6. S-a lucrat la un software care generează automat vizualizări ale datelor, de exemplu vizualizări ale datelor privind bolile infecțioase, utilizând criterii precum județul, anul, tipul de boală. Astfel, datele sunt scoase dintr-o bază de date și sunt apoi afișate grafic. Un exemplu a fost harta firmelor neradiate cu sediu, numărul lor fiind din ce în ce mai mare acolo unde apare culoarea cea mai închisă pe hartă.  Seturile de date privind firmele nu au fost nici ele ferite de erori, codurile unice de înregistrare fiind dublate și alte asemenea inconsistențe care au făcut dificilă reutilizarea.
  7. S-au spațializat seturi de date privind farmaciile și animalele (bovine, ovine). Astfel, printr-o hartă interactivă, sunt reprezenatate pe regiuni, evoluția și numărul de animale și farmacii, urmând să se spațializeze și alte seturi de date. Pe hartă există posibilitatea căutării după an, pe o perioada cuprinsă între 1970 și 2013.
  8. S-a realizat harta spitalelor, cu precizarea specialității și a numărului de paturi disponibile. Graficele aferente arătau că numărul stomatologilor și cel al farmaciștilor sunt în creștere, cu toate că numărul proprietarilor de farmacii este în scădere.
  9. S-a realizat o hartă a firmelor, incluzând informații privind sediul, adresa completă, privind calitatea de plătitor TVA, mergând până la vizualizarea poziționării firmelor pe străzi. Pe lângă datele preluate de pe site-ul guvernamental, au fost utilizate date furnizate de terți pentru a se putea realiza aplicația. Problema însă a fost atribuirea unei denumiri diferite aceleiași străzi de către mai multe autorități publice. Astfel de inconsistențe ar trebui soluționate pe viitor de către autoritățile publice competente, pentru a se evita informarea greșită.
  10. S-a realizat o hartă interactivă a muzeelor, incluzând descrierea muzeului, programul de funcționare, poze și alte informații utile. Mai mult decât  atât, oricine poate introduce informații noi despre un anumit muzeu. Așadar, s-a creat un punct unic unde avem acces la toate informațiile necesare despre muzeele din țară.
  11. S-a început spațializarea celor 18000 de lăcașe de cult din România, dar și a bibliotecilor din România.

 

Toate aceste aplicații au fost făcute voluntar, în doar 2 zile, codul sursă fiind disponibil pentru ca cei interesați să le poată dezvolta. 30 de persoane au arătat că datele guvernamentale au potențial și că se dorește reutilizarea lor de către societatea civilă și de către mediul privat. În același timp, au fost identificate multe erori și inconsistențe în seturile de date de pe portalul guvernamental, care indică că există probleme fie în importul datelor într-un anumit format, fie în culegerea și centralizarea datelor de către autoritățile publice.

 

www.data.gov.ro este o inițiativă lăudabilă, un pas important pentru reutilizarea datelor guvernamentale în România, în beneficiul cetățenilor, care s-ar bucura de informații utile și servicii publice într-un timp scurt, al companiilor private, care își pot construi afacerea pe datele furnizate de agențiile guvernamentale și nu în ultimul rând, în beneficiul autorităților publice, care au posibilitatea de a-și defini politicile publice în funcție de necesitățile identificate. Totuși,  pentru ca aceste lucruri să devină realitate, trebuie soluționate pas cu pas erorile și inconsistențele semnalate privind fiecare set de date în parte. Faptul că reprezentanți ai Departamentului de Servicii Online și Design au luat parte la eveniment și au dialogat cu participanții, e cu siguranță un semn bun, dar așteptăm pași concreți pentru îmbunătățirea calității datelor pe viitor.  În perioada următoare va fi trimis la Guvern un document cu deficiențele de ordin tehnic identificate, în speranța unui dialog cu autoritățile care au furnizat seturile respective de date.

 

Hackathonul din 22-23 februarie a arătat că se pot obține cu resurse limitate, utilizând puținele informații de interes public disponibile într-un format tehnic deschis, multe alte informații interesante și servicii pentru cetățeni. Așadar, pledoaria pentru date deschise continuă!

 

 

Mai multe informații despre proiecte și stadiul în care se află vor fi disponibile în curând aici: http://odd14.datedeschise.ro/ .

 

Fotografiile sunt realizate de Nicolaie Constantinescu.




[1] Fundația Soros România, Fundația Ceata, Asociația pentru Tehnologie și Internet, Asociația Geo-Spațial.org

[2] De regulă, un format tabelar din care are pot fi preluate date prin mijloace automate

[3] Modalitatea juridică prin care se permite reutilizarea liberă informației