Sobre big data, bibliotecaris i documentalistes

juliol 10th, 2014 by genisroca

ItemNo fa massa Albert Díaz Mota i Mireia Siles Planas em varen entrevistar pel número 57 de la revista Item del Col.legi Oficial de Bibliotecaris i Documentalistes de Catalunya, tot parlant de big data. Aquest és el resultat d’aquella agradable conversa:

 

Com podem definir big data? Fins a quin punt estem parlant d’un fenomen nou?

El llenguatge amaga trampes. Quan dius big data hi ha la idea de «ui, ara això de gestionar, s’haurà de fer amb dades!», però si ara tu vas a Caprabo, per exemple, i els dius: «Tu, el que hauries de fer és col·leccionar datasets perquè ja no és possible gestionar sense dades, etc.», jo crec que en alguna d’aquestes, et baixarà una «bufa».

Hi ha tot un ampli sector empresarial que porta molts anys gestionant amb dades, i la sola insinuació que no ho fan o no ho fan bé és per aixecar-se i marxar. Pensa que empreses com Damm, Gas Natural o “la Caixa” tenen perfils demogràfics de cadascun de nosaltres, ens tenen identificats i classificats. Si vas a una empresa de telefonia, t’ofereixen diferents tarifes que venen donades per una anàlisi prèvia quantitativa de perfils poblacionals. Hi ha una volumetria de dades espectacular. Crec que hi ha tota una cultura empresarial que està gestionant amb dades des de fa més de 80 anys i ara arriben quatre i volen donar lliçons a gent que no ha pres mai una decisió sense una dada al costat.

En definitiva, crec que quan parlem de big data s’aprecia molta arrogància. El profeta digital utilitza sovint un to més propi de qui dóna una lliçó als altres sobre com ho han de fer o deixar de fer, i fa una mica de ràbia. Posar en dubte que hi hagi sistemes generals de decisió per dades em resulta excessiu. I m’ha semblat, alguna vegada, veure que qui parlava de big data renyava els altres per no fer servir les dades. Això em molesta molt.

 

Per tant el big data no existeix, o com a mínim no existeix com a concepte nou?

Estem d’acord què el digital genera un flux de dades nou. Les coses que fèiem analògicament, les fèiem i punt, però ara, en fer-les digitalment generem un flux de dades diferent. Per exemple, el sol fet de tenir un telèfon mòbil a la butxaca genera, per triangulació de dades amb les antenes de telefonia, una sèrie de dades d’itinerància de la població que abans, per saber-les, hauria requerit posar un becari en una cantonada del carrer a comptar persones. El que jo crec que s’ha de preguntar és: «El nou flux de dades, l’has incorporat a la teva presa de decisions?». Però el nou, perquè de dades en tenim moltes.

 

I s’estan incorporant aquestes noves dades en la presa de decisions?

No. No, perquè a la majoria d’empreses que conec no existeix la unitat de processament de dades i la dada digital demana procés. El mercat tradicional de dades fa estudis de mercat, oportunitat d’un producte, percepció de la marca, intenció de vot… Hi ha una indústria relacionada, en la qual l’empresari contracta una empresa especialitzada perquè faci una explotació de dades, a través d’un anàlisi quantitatiu, i retorni un resultat. En canvi, aquest flux de dades digital encara no té la infraestructura d’operadors que presti el servei. La majoria d’empreses tenen la dada, perquè tothom que compra a Caprabo, per exemple, passa la targeta client, però no hi ha un operador que els cuini aquesta dada.

 

Qui hauria de fer-ho?

Aquí veig moltes oportunitats. El que passa és que els empresaris no ho veuen clar perquè hi ha molta incertesa legal. Pensen que els pot portar problemes. I jo mateix tinc també molts dubtes sobre el que és legal o no és legal. Per exemple, sé que és il·legal tenir una base de dades que registri opcions personals teves. Si apunto el nom d’una persona, no passa res. Però si poso: «Jo diria que té aspecte d’homosexual», m’acabo de ficar en un problema. I em sembla bé. No està clar si es pot capturar aquest tipus de dades més personals; és un territori perillós.

D’altra banda, potser l’empresa té la certesa que això té valor però no se sap ben bé quin. I si ha de venir un tercer a analitzar la base de dades… Potser no és legal o senzillament no volem que ho faci… Potser li estem donant massa informació, i a més, quin preu li hem de pagar? O és ell qui ens hauria de pagar per proporcionar-li aquestes dades? I per acabar de complicar-ho, els datasets són realment interessants quan els creues amb uns altres. I això augmenta encara més l’estrès legal.

 

Existeixen aquí empreses dedicades a fer anàlisi de dades?

I tant. N’existeixen, i moltes. Accenture té una unitat de negoci a Barcelona, a Sant Cugat, que ningú sap que és de referència mundial. Quan es va morir Michael Jackson, algú de la discogràfica va trucar a Accenture perquè li calculés quants exemplars de CD havia d’imprimir, mercat per mercat, país per país, en base a dades sociodemogràfiques, perfils de consum, etc. I l’empresa ho va fer. Per tant, estan molt a prop.

 

I treballen més a fora que aquí…

Bé, treballen per empreses que tenen molt clar què volen, com es fa… Diríem que hi ha un territori molt professional i un altre d’amateur. Posem per cas una empresa com Mango, a Catalunya. Gestiona amb dades? Segur. Ha incorporat el flux digital en el seu sistema de dades? No n’estic tan segur.

Què fa que una empresa l’incorpori? L’oportunitat. Què vol dir l’oportunitat? La contribució a resultats. Posem l’exemple d’abans amb Accenture. La discogràfica volia vendre el màxim de discos possible, però no volia estampar-ne de més per no córrer riscos, ni quedar-se massa curts. El negoci era prou gran com per encarregar un esforç addicional de processament, perquè estem parlant de molts diners.

Però a Mango, realment, hi haurà una decisió, que s’hagi de prendre, de la qual en depenguin milions d’euros? No ho tinc tan clar…

 

Però només parlem d’empreses o d’aconseguir un benefici econòmic. Ens pots donar altres exemples?

Jo sempre defenso que on l’empresa privada diu big data, l’administració pública diu open data. Si treballes a l’administració, l’accent el poses a l’open, i si treballes a la indústria, l’accent el poses en el big.

Això demostra a què es dedica cadascú. Qui s’orienta a la paraula open el que li preocupa són els usos, mentre que qui s’orienta a la paraula big el que li preocupa és l’envergadura, el procés. Són dues mirades molt diferents.

El model open a mi em sembla un xic naïf, de vegades. Jo el desitjo, el defenso, hi crec, però no sé com el pagarem. Mira per exemple les smart cities o ciutats intel·ligents. Smart city és un concepte que es basa en la sensorització de la ciutat per crear una capa de serveis nova. Tindràs un munt de semàfors a Barcelona o tapes de claveguera o arbres, que et diran coses, com per exemple, el volum de trànsit que hi ha a la Diagonal. Jo crec que aquest projecte és una conseqüència directa de l’aturada de contractació d’obra pública per part de l’administració. Tenim un teixit de vint grans empreses d’enginyeria que tenien 20.000 empleats i ara, quan s’acabi la línia 9 del metro o l’AVE a Figueres ja no tindran feina.

Totes aquestes operadores d’enginyeria tenen tres opcions: fer fora a tothom, anar a fer edificis a Dubai o inventar-se un altre eix d’activitat. Les dues primeres opcions ja les fan i les smart cities representarien la tercera opció. És una Internet que torna a l’enginyeria, no és una Internet social. Només cal veure les empreses que hi ha al darrera. La informàtica industrial i l’enginyeria s’alien per crear les smart cities, una capa de serveis per al ciutadà.

La idea és interessantíssima, però qui ho pagarà això? Les ciutats? A mi em sembla que les smart cities són les noves concessionàries de les autopistes.

 

I això no serà open data?

No. 50.000 semàfors generant dades cada dos segons és big data, però no serà open.

 

Entre el big data i l’open data, podríem situar la data compartida. Aquest nivell de confiança, que permeti compartir dades, s’ha arribat a donar?

Jo crec que l’alternativa a la confiança és el mercat. Vodafone sap quants francesos hi ha a Espanya mitjançant el roaming i el BBVA sap quants pagaments amb targeta han fet els francesos avui a Barcelona, i pot saber la mitjana del seu consum en restauració. Hi ha diversos clients per aquestes dades però, Vodafone deixarà lliures aquestes dades perquè un altre les pugui utilitzar? Jo crec que no. Més aviat es crearan datahubs, empreses que compraran datasets a d’altres empreses i oferiran serveis amb ells. Jo no necessito que Vodafone i el BBVA tinguin confiança entre ells. Només necessito que creïn el seu dataset legal i el venguin. Si jo els compro, i afegeixo els de SABA, TMB, etc., tindré el servei de referència d’informació turística de Barcelona. I de clients, puc tenir centres comercials, cadenes hoteleres, gremis, Turisme de Barcelona…

 

Aquesta indústria intermediària existeix?

Jo crec que no.

 

Els bibliotecaris-documentalistes, què tenim a veure amb el big data?

Jo crec que aquest és un negoci de lletres, no de ciències. A mi m’interessen les preguntes, no les respostes. Qui té mèrit és qui fa la pregunta, no qui processa les dades per obtenir la resposta. A un advocat l’entrenen per anticipar-se als problemes: I si us separeu? I si se’t crema la casa? Als metges els entrenen a detectar símptomes, als físics, en canvi, els entrenen a fer bé la pregunta. A mi els informàtics que sempre m’han agradat són els físics.

Què li reclamaria jo al documentalista? De què és sospitós? De preocupar-se només per l’objecte que vol preservar. De deixar que les preguntes les facin els altres. Ja aniràs tu a fer-me la consulta i jo et donaré el que necessites. Però és clar, en un món on hi ha gent que explota les dades i gent que fa les preguntes, tenir qui te les guardi endreçades, quan n’hi ha tantes i saps que no es poden endreçar, no sé si té molt sentit. Jo, si hagués de mutar, preferiria mutar en algú que fa les preguntes, perquè l’altra banda és entrar en un territori de coneixements tècnics.

El discurs que ens venen amb el big data és que ara es generaran moltes dades. D’acord, però jo encara no he dit quines necessito. Quan faci la pregunta, decidiré quines dades recullo. I fer preguntes vol dir entendre què li preocupa al director d’un hotel, al director de màrqueting d’una companyia aèria, a un ciutadà que vol arribar ràpid al Parc Güell…

 

Com hauríem de fer aquest canvi? Què li demanaries tu a un documentalista per contractar-lo?

Sincerament, no ho sé. A mi qui m’interessa és una persona resolutiva; jo tinc un problema i tu me’l resoldràs. Un documentalista busca informació i selecciona. Aplicat a dades seria: com ajudem al director d’un hotel a decidir en quin idioma s’ha de fer la seva web? Hauràs de buscar les fonts d’informació més adequades i portar-me les cinc més rellevants, no un reguitzell de resultats. Si portes les cinc fonts correctes, seràs una persona valuosa.

 

Fins ara el documentalista s’ha associat més al món acadèmic, universitari, cultural, públic… S’hauria de fer el salt al món privat?

No ho sé això. Jo només dic que al voltant del data existirà una indústria auxiliar i que serà privada. Jo els anomeno datahubs, que aglutinaran un conjunt de dades que poden ser útils per respondre a determinades preguntes. Crec que seran negocis especialitzats i locals: un datahub, per exemple, de Barcelona. Els datahubs podrien ser les biblioteques del futur.

 


0 Responses to “Sobre big data, bibliotecaris i documentalistes”

Feed for this Entry Trackback Address
  1. No hi ha comentaris

Deixa un comentari

L'adreça electrònica no es publicarà Els camps necessaris estan marcats amb *