Da escassez à abundância

Pode interessar a muitos leitores deste blog o texto que pego emprestado do Historia Digital (aliás,  este blog está entrando neste momento para o meu blogroll, sensacional, vale a leitura!).

Boa leitura, espero que lhes seja útil.

*por Jairo Antonio Melo FlórezHistoriador de la Universidad Industrial de Santander, Experto en eLearning 2.0 y estudiante de la Maestría en Historia de la UIS. Miembro del grupo de investigación Políticas, Sociabilidades y Representaciones Histórico Educativas.


De la escasez a la abundancia

Al igual que la historia evenemencial se centró en los acontecimientos notables de la historia para realizar sus estudios, la historia local se ha encerrado tanto en los archivos regionales y locales que se ha aislado del mismo contexto nacional. De cierta manera, se han creado dos bandos donde el primero se centra en las fuentes y parte de la información disponible para hacer sus relatos, muchas veces descriptivos por las mismas limitaciones analíticas que un estudio limitado de fuentes permite; en tanto un segundo grupo supera las angustias de la mera descripción con forzar la información disponible a caber dentro de modelos explicativos exitosos a nivel mundial, lo cual conduce ya no a la insuficiencia analítica sino a la elucubración y tergiversación de la fuente para ser acomodada al modelo.

Es imposible abordar la Historia digital sin pensar en la Historia Global, y pensar en la Historia Global para aquellos que estamos “entrenados” desde nuestra formación al abordaje detallado de una pequeña parte del mundo es algo bastante complejo. El ejercicio sin embargo es sumamente satisfactorio, ya que de hecho mentalmente conecta al historiador con la abrumadora red de relaciones que implica un asunto denominado la Web 2.0, la multiplicidad de lenguajes en el cual está representada esta historia, así como la vertiginosidad del cambio, la debilidad de la permanencia y la digitalización de la realidad material a la cual nos enfrentamos dentro de la globalización y la Internet.

Hugo Fazio Vengoa ha señalado que la Historia Global desplaza el laboratorio del historiador del archivo a la biblioteca[1], así mismo, la Historia digital desplaza el archivo del historiador de la biblioteca a la Web, lo cual hace que el laboratorio del historiador sea aún más vasto. La Historia digital es de hecho una Historia Global por depender necesariamente de un contexto globalizado, difícilmente se pueden hallar fronteras en una figuración donde incluso existe un idioma dominante, el inglés, y un formato único, la pantalla del ordenador, ya sea este de escritorio, portátil o móvil. Sin embargo, es de hecho una acumulación de historias locales que se enfrentan a lo global, al contrario de lo esperado, son las historias subalternas, las memorias ocultas y ocultadas, las que se han visto emerger en el marco de la Historia digital, antes que el dominio de un discurso proveniente de los Estados o de las compañías supranacionales[2].

El reto en este caso, es que se pasa de un contexto de escasez: el archivo regional, la biblioteca municipal, el archivo departamental… a un contexto de abundancia, donde ya el problema no es limitarse a un problema de investigación y a un abordaje descriptivo de la historia por las fuentes disponibles, sino el ahogarse en un mar de datos utilizando fuentes globales, multilingüísticas, multiculturales, donde la búsqueda de la información podría ser tan compleja que obligue al investigador a reducir sus aspiraciones y retornar a la escasez por falta de tiempo para investigar.

La heurística de fuentes en este caso se vuelve ya mucho más compleja, lo cual dependiendo del tipo de problema de investigación al cual se esté enfrentando puede implicar incluso recurrir a la minería de datos o a otro tipo de estrategias técnicas para hallar información relevante en la Web. En diciembre de 1995, William J. Turkle definió a la Web como “un archivo que está en constante cambio y tiene una eficacia infinita”[3], denominó a su proyectoDigital History Hacks, según él, inspirado por la concepción de Tim O’Reilly de Hackingquien habría utilizado el término de una manera positiva para denominar a aquellos “innovadores que exploran y experimentan, descubren atajos, crean herramientas útiles, y llegan a cosas divertidas por sí mismos.”[4] Según Turkle, los historiadores han encontrado y contribuido al diseño de algunas herramientas bastante eficientes para la recopilar la historia presente en la web, como es el ejemplo de Omeka, un Sistema de Manejo de Contenidos para el desarrollo de repositorios o bancos de memoria digital desarrollado por el Centro para la Historia y los Nuevos Medios (CHNM); pero no han desarrollado un sistema para hacer búsquedas históricas, ya no solamente en los repositorios y bancos de memoria digital, sino en el archivo infinito que representa la Web.

El señalamiento de Turkle es bastante coherente, más aún teniendo en cuenta que el debate por la conservación ha dejado de lado el debate por la búsqueda metodológica de fuentes, parte fundamental del oficio del historiador. Turkle, quien ha sido uno de los pocos historiadores que se ha enfocado en el problema de la búsqueda razonada de fuentes históricas en la web, ha encontrado en el método de la minería de datos una posibilidad de enfrentar el caos y permanente cambio de la información de la web, no sólo la acumulada en los repositorios digitales, sino además aquella que se produce y archiva autónomamente por la obra de servicios sociales o en alojamientos virtuales alquilados por usuarios particulares. La minería de datos no es un método que provenga de la historia, ni siquiera de las ciencias sociales, es un conjunto de técnicas que tienen como base la inteligencia artificial y el análisis estadístico, utilizada sobre todo por los estudios de mercado para las empresas[5]. Comprende dos extensiones importantes, la minería web y la minería de textos, con respecto a la primera extensión, esta tiene un dominio de extracción de conocimiento que interesaría a los historiadores, como sería la minería de contenido web, el cual es un proceso de extracción de conocimiento del contenido de documentos o sus descripciones[6]. La minería de textos se considera como una forma de la minería de datos que “permite la extracción de conocimiento de grandes repositorios de información, estructurada o no, en formato texto. El objetivo es… descubrir patrones de comportamiento no visibles y nuevo conocimiento dentro de una colección documental.”[7]

Antes que entrar a profundizar sobre esta técnica, lo que se quiere resaltar es la tendencia de los historiadores a acercarse cada vez más a la tecnología, a la informática específicamente y a la estadística, tal y como lo hicieron en tiempos pasados con la economía, la demografía y otras ciencias auxiliares en la clíometría. William Turkle es visto como “uno de los académicos más osados en este mundo de la historia digital[8]”, debido tal vez a que es uno de los que se acerca en mayor medida a la programación informática, tanto así que escribió junto con Adam Crymble y Alan MacEachern, un hipertexto llamado The programing historian, algo así como “El historiador programador”. En este hipertexto de acceso abierto, Turkle, Crymble y MacEachern, animan a los historiadores a iniciar la adquisición de competencias para programar en lenguaje Python, aunque se parte del presupuesto de que el historiador que se acerca al hipertexto no tiene conocimientos previos respecto a la programación y tiene solamente un manejo funcional de los ordenadores y la Internet. La idea del libro es que el historiador aprenda a programar y a manejar herramientas de acceso libre y código abierto como Zotero, Firefox y Smile, mientras realiza su trabajo de investigación, pero que además, contribuya al hipertexto para mejorarlo, de una manera muy similar a como se construye el software libre[9].

Es difícil ver a un Darnton o a un Chartier tratando de programar en Python mientras realizan sus estudios de historia de la cultura, pero sería difícil abordar un trabajo sobre la historia de la cultura digital sin utilizar por lo menos algunas herramientas propias de la web y de la informática. Hace poco menos de dos décadas, los historiadores pasaron de manera lenta y renuente a utilizar procesadores de texto y tablas de datos para su oficio, poco a poco, el ordenador y el software se ha convertido en una herramienta fundamental en el procesamiento de la información histórica, así mismo, se ha desarrollado software que sirve de manera muy específica para el trabajo del humanista en general, como Atlass-Ti o Nvivo, pero tal vez en muy pocas ocasiones, los historiadores están tan pendientes de generar desarrollos tecnológicos donde ellos mismos formen parte del diseño e implementación de proyectos de base tecnológica, como es el caso del software y los sistemas de manejo de contenidos en la web. En definitiva, es clara una cosa, en el archivo infinito donde estamos inmersos con un solo clic difícilmente podremos investigar armados solamente de un lápiz y un papel.

Continuamente se concretan nuevos proyectos de digitalización y publicación de fuentes, en febrero de este año la Biblioteca Nacional de Colombia “incursionó en la era digital”, y aunque es mejor tarde que nunca, esto permitirá poner en común la documentación como periódicos, mapas, planos y libros históricos, con lo cual “en adelante su acervo bibliográfico y documental podrá estar a disposición no sólo de los colombianos, sino de toda persona que pueda acceder a internet en cualquier lugar del mundo.”[10] El periódico El Tiempo se vinculó al proyecto de Google News Archive, donde están disponibles de manera digital los periódicos desde el número 4 (2 de febrero de 1911) hasta marzo de 2007, aun cuando los últimos años tienen deficiencias en su digitalización, y pueden ser consultados, simulando un lector de microfilms, directamente en un espacio de la versión en línea del periódico[11].

Muchos recordamos hace diez años cuando la biblioteca Luis Ángel Arango puso a disposición su biblioteca virtual, al mejor estilo de la biblioteca virtual Cervantes, en ese momento eran las mejores posibilidades para acceder a recursos bibliográficos en línea, hoy en día el proceso es algo más complejo. Por ejemplo, si se estuviese realizando una investigación relacionada con el Canal de Panamá entre 1889 y 1914, desde el fracaso de la compañía de Lesseps hasta el primer viaje a través del Canal, sería interesante tener a disposición algunos artículos de prensa mundiales relacionados con el asunto, y para ello se deberá afinar la búsqueda mediante las herramientas avanzadas que permiten discriminar fechas, idioma, fuente e incluso precio; para luego navegar por la línea de tiempo y escoger de que mes y año se desean consultar las noticias. Siguiendo con el ejemplo, es posible acceder a noticias relacionadas con el fracaso de la compañía de Lesseps del New York Times[12], o del diario australiano The Age[13], a la revuelta de “negros” por la reducción de los salarios de enero de 1889 señalados en un cable del Evening Post de Nueva Zelanda[14] y comparar esta noticia con otra producida por el New York Times[15], y así sucesivamente es posible realizar una investigación exhaustiva tan sólo con cables internacionales.

Sin embargo, no se puede caer en el entusiasmo tecnológico, varios inconvenientes se deben tener presentes, siendo el primordial la cuestión del idioma. Según el Internet World Stats, el idioma predominante en la Web es el inglés, seguido de cerca por el Chino y de lejos por los demás idiomas encabezados por el castellano[16]. Así, cuando se cambia de idioma en la búsqueda los resultados comienzan a ser nulos o poco relevantes, en francés, por ejemplo, la búsqueda por noticias relacionadas con el Canal de Panamá se remontan tan sólo a 1910, dos de los cuales provienen del periódico L’abeille de la Nouvelle-Orleans, una publicación en francés publicada en la ciudad de Nueva Orleans de 1827 hasta 1923, otra noticia de Le Canada, y una última de 1914 La Justice de Biddeford, estos dos últimos, periódicos canadienses. Una situación similar se presenta con el castellano, donde dominan las noticias provenientes del periódico El Tiempo, con excepción de una nota editorial del “Correo Español”, periódico de la colonia española en México, y otra del “Diario del Hogar”, también de México, los cuales son opiniones antiyankees que incluyen al Canal dentro de sus argumentos.

Viendo lo anterior, es claro que aún las fuentes digitalizadas en estos servicios está limitada en buena medida al idioma inglés, pero así mismo, se relaciona fuertemente con el “anglocentrismo”, ya que la mayoría de los periódicos son de origen norteamericano y de la Commonwealth, al explorar por otras fuentes en contextos diferentes los recursos se vuelven más limitados.

El historiador entonces debe explorar más allá de Google, que a veces pareciera la única herramienta disponible en la Web, y revisar proyectos específicos como el Internet Archive, que al disponer de colecciones provenientes de bibliotecas norteamericanas, remite a una buena cantidad de libros mundiales en varios idiomas, así como el Proyecto del Millón de Libros (que por el momento va por cien mil títulos), entre otras colecciones que en total suman más de dos millones de libros. Si se tiene en cuenta que la biblioteca del Congreso de Estados Unidos alberga más de 32 millones de libros catalogados es claro que la digitalización de libros está lejos de equiparar a las bibliotecas tradicionales.

En el año 2003, Roy Rosenzweig decía que “los historiadores deben estar pensando al mismo tiempo sobre cómo investigar, escribir y enseñar en un mundo de insólita abundancia histórica y la forma de evitar un futuro de escasez de registro.”[17] Aún a pesar de las dificultades presentadas anteriormente, cada vez la historia de la segunda mitad del siglo XX en adelante especialmente se complementa con un mayor número de fuentes de todo tipo, no sólo los tradicionales periódicos y libros, así mismo, documentación fílmica, no sólo a través de los archivos fílmicos como el Moving Image Archive, sino a través de medios como Youtube, donde cada vez se encuentran más aportes tanto de instituciones como de colaboradores espontáneos; The Commons es un proyecto de la Biblioteca del Congreso de Estados Unidos y Flickr donde se encuentran disponibles un número permanentemente creciente de fotografías históricas de todo el mundo alimentadas por instituciones y usuarios.


[1] Hugo Fazio Vengoa, “La historia global y su conveniencia para el estudio del pasado y del presente”, Historia Crítica Edición Especial, (2009): 313.

[2] Hugo Fazio Vengoa, “La historia global”, 318.

[3] William Turkle, “Digital History Hacks” entrada en el blog Digital History Hacks (2005 – 08) Methodology for the Infinite Archive, (18 de diciembre de 2005), http://digitalhistoryhacks.blogspot.com/2005/12/digital-history-hacks.html, (fecha de consulta 25 de octubre de 2010)

[4] O’Reilly Media, “Hacks, a clever solution to an interesting problem”, http://oreilly.com/hacks/, (fecha de consulta 25 de octubre de 2010)

[5] Luis Paulo Vieira Braga, Luis Iván Ortiz Valencia y Santiago Segundo Ramírez Carvajal,Introducción a la minería de datos (Rio de Janeiro: E-papers, 2009): 11 – 12.

[6] Anthony Scime (ed) Web mining: applications and techniques (Londres: Idea, 2005): vi.

[7] Fermín Ezquer Matallana y José Manuel Castellano Delgado, B2S “Big to Small” (Oleiros: Netbiblo, 2010): 22

[8] Anaclet Pons, “Los retos de la historia digital” entrada de blog Clionauta: blog de historia. Noticias sobre la disciplina (Anaclet Pons), (3 de diciembre de 2008), http://clionauta.wordpress.com/2008/12/03/los-retos-de-la-historia-digital/, (fecha de consulta 25 de octubre de 2010)

[9] William Turkle, Adam Crymble y Alan MacEachern, The programing historian (NiCHE: Network in Canadian History & Environment, 2a edición, 2009), http://niche-canada.org/programming-historian/1ed/about, (fecha de consulta 25 de octubre de 2010)

[10] “Con sofisticados equipos, únicos en América del Sur, la Biblioteca Nacional de Colombia incursiona en la era digital” http://www.bibliotecanacional.gov.co/index.php?idcategoria=39859

[12] “The Panama Canal” The New York Times, 8 de enero de 1889, disponible online en http://cort.as/0d3c

[13] “The Panama Canal. An English Criticism” The Age, Melbourne, 7 de enero de 1889, p. 5, disponible online en http://cort.as/0d3e

[14] “The Panama Canal. A completion estimate.” Evening Post, Wellington, Volumen XXXVII, Número 23, 28 de enero 1889, p. 2, disponible en http://cort.as/0d3j

[15] “The Panama Canal Strike. But three men hurt during the temporary suspension of work.” The New York Times, 26 de enero de 1889, disponible en http://cort.as/0d3n

[16] Internet World Stats, “Internet World Users by Language”, Junio 30 de 2010, disponible en http://www.internetworldstats.com/stats7.htm

[17] Roy Rosenzweig, Clio wired: the future of past in the digital age. (New York: Columbia University Press, 2011) 6

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s