miércoles, 12 de mayo de 2010

Calibre 8

    Calibre 8 es una autodenominada wikinovela colaborativa muy interesante, muy cuidada en su interfaz que no sólo es grato a la vista sino simple de navegar. Pero no es una wikinovela en el sentido clásico porque, para empezar, no utiliza la wiki ni su formato para desarrollarse. Lo que sí utiliza es el concepto de que varios autores puedan ir ampliando el relato añadiendo texto a lo ya escrito, al modo de un cadáver exquisito. En esta obra, los añadidos no pueden subirse directamente sino que es necesario enviar la propuesta a los administradores vía e-mail y estos se encargan de volcar el contenido. A pesar de ser sólo un proyecto universitario, está diseñado con mucha calidad. En la propia introducción, los autores señalan que no desean indicar sus nombres ya que se trata de una novela colaborativa en la que todos los participantes son autores. Aún así, los créditos muestran que son Ángel Anaya Barroso, Laura Blanco Villa , María Belén Belotto García , Jose Cardona Sanz, Fernando Gimeno García , Elena Lázaro Mateo, David Mairena García y Antonio Mateo Cabrera. La imagen es tradicional en el sentido de que imita a un libro del que se van pasando las hojas. La red de enlaces es, no obstante, bastante lineal. La historia está bien escrita y es el corazón de la obra, como parece lógico hablando de literatura digital. Obviamente, no está terminada. Nunca lo estará.

Entrada publicada por Félix Remírez en Biblumliteraria

Share/Save/Bookmark

lunes, 10 de mayo de 2010

Composition nº 1, Marc Saporta


    Entre los precursores de los textos no lineales, de la fragmentación del discurso que hoy sirve de paradigma a la literatura hipertextual se encuentra el novelista francés del nouveau roman Marc Saporta. Su libro Composition nº1 (París, Seuil,1962) está compuesto de 159 páginas sin encuadernar y sin numerar, dispuestas al azar en una carpeta que les sirve de cubierta.
     En su prefacio el autor indica: "Se ruega que el lector disponga de estas páginas como de una baraja de cartas. Que corte, si lo desea, con la mano izquierda, como si fuera una cartomántica. El orden en el que las hojas salgan de la baraja orientará el destino de X. Del encadenamiento de las circunstancias depende que la historia termine bien o mal. Una vida se compone de elementos múltiples. Pero el número de composiciones posibles es infinito."
     Se produce, pues, una nueva historia con sentido cada vez que se barajan las páginas. Conseguir ese sentido exige una enorme paciencia, destreza e ingenio. Queneau, como ya vimos en este blog, conseguía sonetos distintos "barajando" los mismos versos, Saporta cuenta novelas distintas barajando los mismos capítulos.
    Max Aub también escribió una obra parecida,"Juego de Cartas", el mismo año 1962 en París, pero cuando salió la de Saporta aplazó su publicación hasta 1964 en Méjico, donde la editó Alejandro Finisterre.

Entrada publicada por Juan José Díez
Share/Save/Bookmark

domingo, 9 de mayo de 2010

Magazine del Domingo (16-5-2010)



     *Ponencia de Vicente Luis Mora en el encuentro Hybrid Storyspaces celebrado en Cornell University el pasado 1 de Mayo: Text and Internext: the literary change to fluid texts and its effect in current narrative.


     *En el blog de Miguel Calvillo se nos habla de Prezi, un editor de presentaciones flash que puede usarse también para animar textos. Calvillo prueba a sacarle partido haciendo que los versos de un poema se acerquen, se alejen o cambien de orientación a medida que van apareciendo. Destacamos dos ejemplos con Góngora y Miguel Hernández.


     * Revolt of the Mouses, un imaginario campo de batalla en el que los ratones de ordenador se enfrentan a los tradicionales medios de escritura: lápices, bolígrafos, gomas. El ataque a Paperlandia termina en una derrota que es a la vez parodia. Este corto de animación y su espectacular banda sonora han recibido numerosos e importantes premios.
Entrada publicada por Juan José Díez
Share/Save/Bookmark

viernes, 7 de mayo de 2010

Lingüística computacional (III)



(El capítulo anterior de esta serie puede leerse
aquí)


La búsqueda de gramáticas que describieran formalmente el lenguaje tomó impulso con los trabajos de Noam Chomsky (en la fotografía superior) en los años cincuenta y sesenta del siglo XX.

Hasta entonces, la gramática era descriptiva. Las técnicas del análisis sintáctico definían cada componente de la frase pero no se abordaba la cuestión fundamental: ¿Cómo el hablante ha conseguido crear una frase correcta, incluso cuando jamás antes ha escuchado la misma?. Un asunto que, como señalaba Chomsky, era algo auténticamente misterioso. Chomsky se percató, también, de que el individuo es capaz de generar infinitas frases diferentes a partir de un conjunto finito de palabras y construcciones fundamentales. De hecho esta capacidad es el fundamento de la literatura. Como hablantes o escritores no nos limitamos a repetir frases que ya hemos escuchado, sino que las creamos en función de las necesidades de cada momento. Y, a la inversa, como oyentes, sabemos que son correctas y entendemos las oraciones que los otros enuncian, o escriben, a pesar de no haberlas leído o escuchado antes.

Estas reflexiones condujeron a desarrollar gramáticas que ya no eran explicativas sino que debían dar cuenta de la generación de oraciones correctas, es decir condujeron a las gramáticas generativas. Asimismo, introdujo una visión conceptual muy distinta sobre el lenguaje. Mientras que, hasta Chomsky, predominaba la idea de que la mente del niño era una pizarra en blanco que iba llenándose con los modelos que escuchaba a su alrededor (visión conductista del lenguaje), Chomsky afirma que debe existir un conocimiento formal, previo a la experiencia, que permite al cerebro manejar la lengua correctamente aún cuando no haya oído la gran mayoría de las frases posibles con anterioridad. También, todo esto implicaba que la gramática podía dejar de estudiar extensos corpus de una lengua para centrarse en las reglas internas inherentes.

En los años sesenta del siglo pasado se asiste a una revolución en cómo se entiende el lenguaje y la gramática. El propio Chomsky desarrolla el primer modelo – llamado estándar- que rápidamente se ramifica en otros varios. Desde entonces, se han desarrollado muchos otros, entre los que se pueden destacar:

Gramáticas generativas o sintagmáticas

Estas se pueden subdividir en dos grandes grupos, como son las gramáticas de transformación y las de unificación y rasgos.

- Gramáticas de estados finitos.
- La teoría estándar (ST o TGG) y la estándar extendida basadas en las ideas iniciales de Chomsky.
- La teoría minimalista (MP).
- La teoría GB (Government and Binding), traducida al español de forma un tanto forzada, por teoría de rección y ligamiento.
- Semántica generativa (GS).
- La gramática relacional (RG).
- La gramática APG (Arc Pair gramar).
- La gramática LFG (Lexical- functional Grammar).
- La gramática GPSG (Generalised Phrase Structure Grammar) o gramática de estructura sintagmática generalizada.
- La gramática HPSG (Head driven Phrase Structure Grammar) p gramática sintagmática nuclear.
- Gramática FUG(Functional Unification Grammar)
- Gramática TAG (Tree-adjoining grammar).
- Gramáticas IG (Indexed Grammars).


Gramáticas estocásticas

- Gramática OT (Optimality Theory).
- Gramática SCFG.


Gramáticas de dependencias

- Sintaxis algebraica.
- Gramática de las palabras.
- Gramática operativa.


Gramáticas funcionalistas

- Gramática funcional.
- Gramática de Praga.
- Gramática cognitiva.
- Gramática funcional sistémica.
- Gramática constructivista.
- Gramática de rol.


Queda fuera del alcance de estos posts el profundizar en cada una de ellas (y, con seguridad, más allá de mis conocimientos) pero podremos indicar algunos conceptos básicos.


La jerarquía de Chomsky

Chomsky definió la jerarquía de gramáticas del siguiente modo:

Gramáticas del tipo 0

Son aquellas que no tienen ninguna restricción y que engloban a todas las demás. Permiten toda clase de flexibilidades expresivas, recursividad, frases complejas, solventan la ambigüedad, etc.

Gramáticas del tipo 1

Son gramáticas que permiten reglas de formación del tipo

aAb -> agb

donde A es un elemento no terminal (es decir que requiere ser desglosado en subtérminos como le puede ocurrir, por ejemplo, a un SN) y las letras minúsculas son o no son terminales. "g" debe ser no vacío.

Este tipo de gramáticas del tipo 1 se llaman dependientes del contexto porque, - a partir de la ecuación que define la regla-, A puede ser sustituido por g si y sólo si A y g están acompañadas por a por la izquierda y b por la derecha (no existe la propiedad conmutativa). Es decir, no siempre puede darse la sustitución sino sólo en ciertos contextos.

Gramáticas del tipo 2

Son gramáticas que permiten reglas de formación del tipo

A->g

Donde A es un elemento no terminal y g es una cadena combinada de términos terminales y no terminales (por ejemplo, “N SV SP”).

Estas gramáticas del tipo 2 se llaman independientes del contexto porque como se observa, – a partir de la ecuación que define la regla-, A puede ser sustituido por g cualquiera que sea lo que lo rodea (de hecho, no hay nada rodeando a la cadena).

Gramáticas del tipo 3

Son gramáticas que permiten reglas de formación del tipo

A->tB
A->t

Donde las letras mayúsculas (A, B) indican elementos no terminales (es decir que requieren ser subdivididas en otros elementos ) y las minúsculas indican elementos terminales (que ya no requieren subdivisión).

Estas gramáticas de tipo 3 se llaman regulares y son las que pueden ser evaluadas por un algoritmo sencillo del tipo autómata finito.


Gráficamente, las gramáticas de tipo 0 engloban a las del tipo 1, estas a las del 2 y así sucesivamente.

Ni que decir tiene que las más sencillas de implementar en un ordenador son las del tipo 3 y las más complicadas las del tipo 0.



Hoy en día se piensa que las gramáticas del tipo 2, independientes del contexto, son suficientes para analizar y generar una amplia cantidad de casos que aparecen en una lengua sin necesitar recurrir a gramáticas superiores mucho más complejas y, por ello, han recibido un alto grado de atención y desarrollo.

Gramáticas de estados finitos

También llamadas gramáticas de cadenas de Markov, redes de transición o gramáticas regulares. Son las más sencillas, como se ha visto en la jerarquía anterior. Se trata de gramáticas que pueden ser plasmadas en algoritmos sencillos secuenciales (máquina de estados finitos) en un ordenador y que se fundamentan en ir recorriendo una cadena de reglas, cumpliéndolas hasta dar con una frase generada correcta.

En estas gramáticas, como dijimos, las reglas son del tipo:

A->tB
A->t

Donde las letras mayúsculas (A, B) indican elementos no terminales (es decir que requieren otro elemento posterior) y las minúsculas indican elementos terminales (que ya no requieren nada después). Por ejemplo, una regla de este tipo sería:

O->"una" NON

El programa iniciaría su búsqueda de frases con “una” y buscaría después una regla NON que forzosamente ha de seguirla.

Veamos un conjunto de reglas de una gramática de este tipo, a título de ejemplo:

O->una NOM
NOM-> mujer VER
NOM-> vaca VER
VER -> muge END
VER-> habla END
END ->

Este conjunto de reglas puede también plasmarse mediante un grafo:



¿Cómo funcionaría un ordenador generando frases con esta gramática de estados finitos?

Supongamos que introducimos la primera semilla, “una”.

El algoritmo encontraría que en su base de datos hay reglas que permiten comenzar por la palabra “una”. Arrancaría el proceso, llegaría al primer nodo (NOM) y encontraría dos rutas a seguir, añadiendo “mujer” y “vaca” a la frase que está construyendo. Continuaría su recorrido y llegaría al nodo VER en donde volvería a encontrar dos ramales y podría generar:

Una mujer habla
Una vaca muge
Una mujer muge
Una vaca habla


Ya vemos que un ordenador dejado al albur de un algoritmo tan sencillo puede generar muchas frases lícitas pero también muchas ilícitas por lo que pecaría de sobregeneración. Además, si la semilla inicial hubiese sido “un”, el algoritmo se hubiera detenido nada más comenzar al no hallar regla alguna que empezara con “un”.

Es evidente que los grafos pueden ser mucho más complejos y no limitarse a dos ramales por nodo. Por ejemplo:




Una red de este tipo puede llegar a ser realmente amplia e intratable para un ser humano. Pero para un ordenador es precisamente una tarea idónea que se puede calcular en microsegundos.

Los algoritmos de este tipo no pueden procesar la recursividad que vimos en el capítulo anterior ya que, una vez situados en un nodo, deben seguir hacia adelante sin ser capaces de evaluar cuántas veces se ha de retroceder. Asimismo, tienen dificultades para tratar oraciones que no están secuencialmente ligadas, como son las de relativo.

Aunque desde un punto de vista teórico estas gramáticas tienen demasiados puntos débiles al no poder categorizar muchas posibles estructuras gramaticales, son ampliamente usadas dado que, en la práctica, el habla cotidiana se ciñe precisamente a estructuras sencillas. La aplicación de este tipo de programas en el análisis morfológico es ya común y puede presentar resultados razonables.

Evidentemente, si pensamos en literatura digital de calidad, necesitaríamos precisamente sentencias menos comunes, más elaboradas, ricas, y esta gramática se nos quedará corta.


Seguir leyendo en
Biblumliteraria


Entrada publicada por Félix Remírez



Share/Save/Bookmark

miércoles, 5 de mayo de 2010

THE WINTER HOUSE




      El cuento quizá sea la forma de narrar más antigua, la que mejor se corresponde con el deseo humano de contar historias. Pero hoy, para muchos, también sería la que mejor se adapta a las nuevas tecnologías, a los nuevos hábitos de los "pan-lectores", pues su corta extensión favorece una lectura en pantalla menos fatigosa y no exige una atención tan sostenida como, por ejemplo, ocurriría en el caso de una novela. Los cuentos tradicionales han ido por lo común acompañados de ilustraciones y hoy nos ocupamos precisamente de un cuento ilustrado con recursos multimedia. 
     The Winter House, escrito en este año 2010 por Naomí Alderman y webilustrado por Jey Biddulph, es un cuento que se desarrolla en Inglaterra a principios del siglo XX. Millie llega a su casa tras recibir la noticia de la muerte de su padre, un profesor de historia en Oxford; ante una serie de indicios extraños inicia una investigación sobre su muerte
    Aunque incluye unos pocos elementos interactivos típicos de los juegos, es sin embargo una simple historia con un narrador en tercera persona. La visualización del cuento deja a las palabras el protagonismo central, de manera que el texto siempre lleva la voz cantante y la animación en flash sirve sólo para la escenografía. La visualización respeta la atmósfera del cuento y encuentra siempre imágenes y sonidos que se acoplan perfectamente como fondo de lo que se lee en la pantalla. En cuanto a navegabilidad, algunas veces no está claro cómo seguir el hilo y hay que desplazar el cursor por distintas zonas hasta verlo activarse. El efecto total es de una coherente belleza en la ambientación, tan tradicional por otra parte en las películas y series de televisión inglesas.
Entrada publicada por Juan José Díez

Share/Save/Bookmark

martes, 4 de mayo de 2010

De cabeza en un bajío

    Y como a los hayedos que migraban hacia el lugar ocupado antes por los pinos en el ecosistema del Montseny se les caían las hojas en otoño, la tierra que los sostenía quedó desprotegida y pronto le faltó agua a sus raíces. Y los hayedos se despojaron de individuos y el Montseny quedó más despoblado y las abejas, que llegaban puntuales cada año, perdían su ventana de oportunidad porque no había polen en las flores, porque estaban atrasadas en la maduración. Y las abejas también se despojaron de individuos y fueron menos y hubo menos miel y menos polinización y menos hayas. Y los hayedos cenceños seguían subiendo por la ladera, expulsando sus semillas hacia lo alto, porque algo tenían que hacer. Así anotaba el maestro catalán en sus notas, que publicó El País en su dominical un domingo de 2007.

     Los editores no hacen estudios de mercado. No es por avaricia ni por falta de profesionalidad; es, sencillamente, porque nunca han pensado que hacen productos para la gente, como en cambio les sucede a quienes idean y elaboran electrodomésticos, pipas, o dispositivos de lectura. Lo más lejos que llegan los editores en la imaginación de su negocio es a la puerta de la librería. Aun así, existen empresas como, por ejemplo, R. R. Bowker, que viven de hacer estudios de mercado para el sector del libro. Sus informes se publican en los medios especializados, merecen comentarios e incluso informes de informes, como el que Jim Milliot publicó el 14 de abril en Publishers Weekly, la destronada Biblia del sector.

    No he tenido acceso al informe de Bowker, porque es de pago y resulta un lujo inalcanzable si uno no es, por lo menos, RandomHouse; pero los informes del informe dicen así:

    En los Estados Unidos, que es el lugar de donde nos llegan las noticias y bien haríamos en conocerlas, en 2009, los títulos publicados por sus propios autores, editores improvisados y zombies (emprendedores dedicados a la puesta en venta de obras que están en el dominio público, ya sea en forma de ebooks o de ediciones bajo demanda) casi triplicó las novedades kosher (o jalal, como uno prefiera) de toda la industria editorial organizada.
  • 764.448 títulos fueron libros publicados por sus propios autores; por editoriales mínimas de nicho sin pasado ni futuro reconocibles; por vanity presses, o por zombies que aprovechan el dominio público.
  • 288.355 títulos salieron de lo que todavía se considera "la industria editorial" establecida que, de aquí en más, llamaremos "tradicional".
  • Los títulos de narrativa vieron su segundo año consecutivo de caída y solo sumaron, en esta ingente producción, 45.181 títulos. 
  • Todas las tiradas se redujeron, menos en los títulos del subgénero "infantil y juvenil", aunque también aumentó la cantidad de novedades.
  • De la edición no tradicional, responsable de 764.448 objetos que se reputan de "contenido", la cosecha ha estado sobre todo teñida de biografías, autobiografías, testimonios, crónicas subjetivas, consejos, más autobiografías y más consejos e historias de familia. Tampoco faltan, y hasta son numerosas, las historias de éxito o infortunio personal.
  •  El crecimiento de la producción, con respecto al año anterior, es del 87 %.
    Gran parte de esta metástasis se puede encontrar en la Red. Una mínima parte, en Amazon. Una ínfima parte, en las librerías. Sin embargo, la gran mayoría es inhallable. También ese libro maravilloso que uno esperaba encontrar y leer y que, tal vez, publicó un editor en cuyos criterios solíamos confiar.

    Opinadores doctos como Mike Shatzkin nos conminan a digitalizarnos o perecer, pero también nos advierten que la digitalización en sí misma no es solución. La explosión de contenidos de la que somos testigos y hacedores, con la consecuente devaluación de los mismos, ha transformado el lugar de llegada de nuestras migraciones en un bajío, adonde nos hemos echado de cabeza sin contar con que los lodos habían crecido y escaseaba el agua. 

     Las redes sociales, de las cuales viven tantísimos expertos en márketing viral, por el momento no hacen más que reproducir lo que sucede en el mundo biológico: el inquietante efecto longtail que estudia la física estadística. Sin ir más lejos, la reciente campaña de Dosdoce para el Día del Libro en Twitter (#1libro1tweet) arroja como resultado de las libres e impolutas preferencias "comunitarias" los mismos títulos anunciados como best-sellers  por la más grande librería online en español, La Casa del Libro, propiedad de Planeta.

     La marea está baja y no parece buen momento para zarpar. Sin embargo, tampoco es el día de las trompetas finales. Si somos incapaces de sostener al librero de cabecera que siempre fue nuestra razón de ser y si tampoco basta con huir hacia la digitalización, ¿no sería el momento de dejar tanta agitación y pensar qué está pasando y en qué consiste esta profesión y este negocio de editor?

Entrada publicada por Julieta Lionetti en Libros en la nube
Share/Save/Bookmark

domingo, 2 de mayo de 2010

Magazine del domingo (2-5-2010)



* En Frontera D Doménico Chiappe reseña la obra de Benjamín Escalonilla "Encuesta: ¿es usted un inconsciente?"

* Saludamos la aparición del blog de Álvaro Llosa El Hilo Digital sobre literatura hipermedia y edición electrónica. A una bella factura añade unos contenidos iniciales de los que cabe esperar lo mejor.

  Boek Visual, un completísmo blog sobre poesía visual. Si miramos su Antología de Autores nos llevaremos continuas sorpresas con objetos que nadie pensó jamás que pudieran juntarse.
Share/Save/Bookmark

viernes, 30 de abril de 2010

Lingüística computacional (II)






(El capítulo anterior de esta serie puede leerse
aquí )


Para que el lenguaje pueda ser procesado por un ordenador de manera mecánica es necesario plasmar el funcionamiento de un idioma en un modelo formal que pueda ser manejado por una máquina. La lingüística computacional, por tanto, debe desarrollar modelos del lenguaje que permitan decidir cómo se forman las oraciones, cuáles están bien creadas, si su significado es correcto, etc. Y, además, estos modelos deben ser matemáticos, tratables por algoritmos de cálculo.

Hay dos grandes tipos de modelos del lenguaje:

a) Modelos algebraicos o axiomáticos en los que el idioma se representa por medio de símbolos que pueden ser combinados y analizados de acuerdo a la teoría de conjuntos y la lógica algebraica. Estos modelos contienen un conjunto de elementos sobre los que aplicar los cálculos (que, en primera instancia, podríamos identificar con las palabras del idioma), un conjunto de restricciones que establecen qué combinaciones de los elementos son admisibles (por ejemplo, que un sustantivo y un adjetivo deben concordar en género y número) y un conjunto de reglas que pueden aplicarse sobre los elementos y las restricciones (por ejemplo, que una frase posible es determinante+sustantivo+verbo+adjetivo) de modo que se generen oraciones válidas.

Un modelo de este tipo intenta plasmar la estructura lógica del lenguaje.

b) Modelos estadísticos en los que no se pretende una representación precisa del idioma sino que se analiza la frecuencia estadística de la aparición en el mismo de ciertas palabras, combinación de ellas, cada morfena, cada sintagma, cada categoría sintáctica, cada significado en caso de ambigüedades, etc. Si la base de datos sobre la que actúa un modelo de este tipo es suficientemente grande será muy probable que pueda encontrarse una oración o que pueda completarse otra a partir de ciertos componentes.

Las aplicaciones comerciales existentes, especialmente en el caso de los traductores computerizados, se basan más en modelos estadísticos mientras que los desarrollos del lenguaje en el ámbito de la inteligencia artificial y la búsqueda del ordenador hablante se basan en los algebraicos. Y en la creación automática de literatura es muy posible que esta aproximación sea también más posibilista.


Los modelos algebraicos

Vimos anteriormente que, simplificando, un modelo algebraico contiene tres partes fundamentales: el conjunto de símbolos, el conjunto de restricciones y el conjunto de reglas.

El conjunto de elementos es el diccionario sobre el que queremos actuar. Si se trata de una aplicación genérica, ese conjunto será el total de palabras de una idioma. Por el contrario, si se busca un programa especializado en un campo determinado (por ejemplo, un algoritmo que interactúe en el diagnóstico médico), ese corpus se reducirá a ese nicho específico, lo que simplificará el tratamiento.

Dentro del conjunto de elementos pueden existir subconjuntos complementarios. Por ejemplo, si además de comprender expresiones y crearlas en pantalla, la máquina debe escucharlas y hablarlas, entonces deberemos tener una base de datos fonética.

El conjunto de reglas incluirá todas aquellas formas admisibles en la construcción de frases. Así, en castellano, una regla que habría que introducir en el algoritmo sería:

SN -> (DET) + N

Ecuación que puede leerse como Un sintagma nominal se compone de un determinante opcional y un nombre.

Con esta regla se pueden formalizar enunciados como El caballo. El componente entre paréntesis significa que puede ser opcional. En el sintagma nominal anterior, sólo el sustantivo es obligatorio.

Pero también podemos fijar reglas como:

SN -> (DET)+ N+ (ADJ) para, por ejemplo, El caballo blanco

O bien:

SN -> (DET)+ (ADJ) +N+ (ADJ) para, por ejemplo, El bonito caballo blanco

En la fase de análisis, usualmente muy laboriosa, es preciso determinar todas las reglas posibles y las excepciones (que no son sino reglas adicionales).


Seguir leyendo aquí.

Entrada publicada por Félix Remírez


Share/Save/Bookmark

miércoles, 28 de abril de 2010

Migraciones forzosas


    En 2007, el dominical de El País publicó un reportaje sobre un maestro catalán aficionado a la botánica, que dejó unos cuadernos de notas sobre qué les pasaba a las plantas y a los árboles de su comarca. Empezó a tomarlas en 1952, cuando yo todavía no había nacido. El reportaje, que no guardé ni encuentro hoy en Google, me impresionó muchísimo porque, a partir de las notas del maestro rural, podía ver los queridos bosques del Montseny caminando hacia las cumbres, moviéndose al igual que se movía el bosque de Macbeth. Los pinos de altura, que aseguran frescor y sombra, se veían desplazados por los hayedos, que subían y subían para refrescar sus raíces, pero las hayas son caducifolias y no podían asegurar el frescor ni la sombra que sus propias raíces necesitarían en poco tiempo, cuando llegara el verano.
    Más o menos por entonces, Cecilia Tan, escritora, editora y fundadora de Circlet Press, iniciaba otra migración: de los libros de papel a los libros electrónicos. Y por motivos bastante parecidos a los de los hayedos del Montseny. Hace unos días, subió a la Red el contenido de una charla en la que cuenta esta experiencia, en el contexto de la conferencia From Gutenberg to Google, organizada por Bookbuilders of Boston y el Emerson Publishing Club. Traduzco y subo aquí sus reflexiones porque tienen la fuerza de la experiencia vivida y están muy lejos de las especulaciones teóricas a las que nos hemos acostumbrado en este momento de r/evolución digital en el mundo del libro. Creo que serán de gran provecho tanto para editores independientes como para libreros de cabecera.

    Los tres retos candentes a los que se dirige Cecilia son:
  • la transición del entorno físico de la librería al entorno online;
  • la importancia de la participación del autor en las redes sociales;
  • la piratería; (¡glups!)
      Aquí, sus palabras:
      "No llegué a los ebooks ni me coloqué a la vanguardia de la innovación de las tecnologías del libro porque pensara que los ebooks eran la nueva onda y quisiera estar en el centro de la acción. No, en lo esencial, me vi forzada a convertirme en una experta en ebooks o mi editorial se iba a la deriva. Fundé Circlet Press en 1992, mucho antes de ese pequeño inconveniente que hoy llamamos la Crisis de las Devoluciones.
     La historia de Circlet es agitada: nos golpearon todas y cada una de las convulsiones de la industria editorial desde el año de nuestra fundación. Sobrevivimos a la quiebra de Inland Book Company; después, a la suspensión de pagos del distribuidor LCD. Si le echaran una mirada a mi lista de Clientes Importantes de hace diez años, verían una relación de al menos 50 mayoristas y minoristas que o bien han cerrado el negocio, o que han dejado de comprar libros o que han disminuido drásticamente sus pedidos y dejado de lado nuestros títulos.
     Bookpeople ha desaparecido, Tower Records ha desaparecido, Lambda Rising ha desaparecido, y la lista sigue. De aquellos 50 clientes importantes, sólo quedan dos y son Borders y Barnes&Noble.¿Qué pasaba si alguna de las dos grandes cadenas de librerías decidía no pedir alguna de nuestras novedades? No teníamos más alternativa que cancelar la publicación.
      Las cosas fueron a peor: hubo títulos que ninguna de las cadenas aceptaron o de los cuales pedían cantidades tan exiguas (100 ejemplares o menos) que me preguntaba para qué se tomaban la molestia. A esas alturas, en 2008, la entrada de caja era casi nula y Circlet Press estaba, en principio, muerta.
Como ya no tenía nada que perder, empecé a convertir nuestro fondo en ebooks y a ponerlos a la venta en la tienda de Kindle o en el sitio de Fictionwise, tan solo por hacer *algo*. No tenía dinero, pero si para empezar a vender ebooks lo único que hacía falta era una inversión de sudor, bueno, eso estaba en condiciones de ponerlo. Aprendí a formatear para Kindle por mis propios medios y pasé por el aro de Fictionwise, et voilà! 
   ¡Ebooks!
    Las ventas eran irrisorias. Pero, teniendo en cuenta que, en aquel momento, los costes de puesta en marcha de un ebook eran casi equivalentes a cero, porque empecé con títulos cuyos derechos ya tenía y tan solo ponía capital sudor, hasta esas ventas insignificantes eran mejor que nada.
    Después, empezamos a hacer ebooks originales. En lugar de restringirnos a la conversión del fondo, empezamos a producir títulos nuevos por primera vez en años. Circlet Press siempre ha publicado muchas antologías y libros de cuentos: los transformé en programas para becarios en prácticas. En las 12 semanas de duración de las prácticas, podía guiar a un becario a través de todo el proceso, empezando por el pedido de propuestas a los autores, la selección de los cuentos, la revisión y la edición, la composición tipográfica y el diseño del PDF, el posterior formateo para Kindle y otras plataformas, ¡y listo! El libro estaba vivo y a la venta antes de que el becario hubiese abandonado mis oficinas. Por las venas de una editorial corren dos elementos vitales: dinero e ideas. De pronto, teníamos un constructivo flujo de ambos, cuando apenas unos meses antes estábamos más muertos que clavo remachado.
     Dos años más tarde, hemos logrado beneficios durante dos ejercicios (después de 5-7 años de pérdidas) y ahora cuento con un equipo de seis editores externos que contratan y editan libros para nuestro nicho y, al paso que llevamos, este verano será el de nuestro apogeo, con el lanzamiento de un nuevo título electrónico por semana. Muchos de ellos solo venderán unos pocos cientos de ejemplares a lo largo de 2-3 años, pero cada uno de ellos recuperará la inversión y dejará beneficios, y muchos de ellos significarán ingresos más importantes para el autor de los que jamás hayamos pagado por un libro impreso.
     Hecha la transición del papel a lo digital, hay tres temas candentes a los que quiero referirme y que están íntimamente relacionados. Piratería; redes sociales y la importancia de que el autor participe en la promoción de su libro; y la transición de un modelo de negocio centrado en las librerías a un modelo digital. ¿Qué tienen en común estos tres puntos? 
       La capacidad de ser descubierto
     El primer obstáculo con que se encuentra un libro es la falta de atención que le impide ser descubierto.
     Uno puede haber escrito el mejor libro del mundo, pero si no está en los anaqueles de la librería, ¿cómo se enterará su posible lector? Toda la gente de prensa y promoción de las editoriales sabe que, en el modelo de negocio tradicional, si el libro no está en las mesas y en los anaqueles cuando uno logra cobertura en los medios más importantes o hay una gran presentación del autor, se pierde casi todo el repunte de ventas que se habría logrado.
     El antiguo método para descubrir libros era, para la gran mayoría, ir a la librería, pasearse por sus pasillos y ver qué había.
      Este método se está desmoronando por varios motivos. Hay menos librerías. Las que hay, en buena medida, pertenecen a grandes cadenas, a menudo no tienen librero de cabecera que jerarquice el abastecimiento y sus existencias son paupérrimas. Hace poco, Borders hizo una reducción masiva de su inventario que se tradujo en menos títulos por anaquel. Los libreros independientes, con excelentes políticas en la elección de títulos, a menudo se encuentran con grandes desafíos de inventario y de flujo de caja. Aun así, la razón por la cual nosotros, los editores, seguimos vendiendo los libros en consignación y con derecho a devolución es que la mejor manera de vender un libro es que esté a la vista en los anaqueles para que el consumidor lo encuentre.
      Entonces, ¿qué pasa cuando hay menos librerías, menos anaqueles y más competencia por el espacio que queda? Uno se ve obligado a explorar otros métodos que permitan el descubrimiento de la obra. Y, desde luego, los ebooks no necesitan ni librerías ni anaqueles físicos.
      En materia de ebooks, descubrimos que hay que tener los libros colgados en las páginas de los minoristas con más tráfico. Hay algunas excepciones como, por ejemplo, La cueva de Ellora y Torquere Press, dos editoriales especializadas en novela romántica, que han construido también modelos de relación directa con el consumidor. Pero para una editorial generalista, construir una marca que la haga reconocible es más difícil. En estos casos, es el autor quien posee el nombre de marca, no RandomHouse o St. Martin's Press. De manera que hay que tener los libros en la tienda de Kindle, en Fictionwise y también en la tienda de Mobipocket: los sitios donde ya está congregada la gente que quiere ebooks. Lo que en las librerías era un paseo a pie, se ha transformado en un paseo de miradas en los websites.
     ¿Qué se puede hacer para acrecentar los paseos de las miradas?
     ¿Quieren saber dónde se congregan los más ávidos lectores de libros electrónicos que navegan por la Red? En los sitios piratas. Y aquí está el asunto. La gente que piratea libros no es gente que odia los libros ni a los autores. Es como decía Nietzsche. El águila que se come al cordero no odia al cordero. El águila adora al cordero. A esta gente la chiflan los libros. Son insaciables. Por eso frecuentan los sitios piratas y hablan de sus autores favoritos en los foros y preguntan por otros dispuestos a compartir sus archivos digitales e, incluso, crean versiones digitales de los libros que todavía no las tienen.
     Hasta ahora se ha realizado un par de estudios donde se señala que el aumento de la piratería digital de un título parece conducir al aumento de las ventas de la versión impresa. El jurado sigue deliberando sobre si un libro que sólo existe en como ebook resulta perjudicado por la distribución pirata, pero, ¿qué hay si lo que uno quiere es vender libros de papel? Ser pirateado, en este caso, equivale a vencer de alguna manera el inconveniente de la ausencia de descubrimiento. Cuanto más piratas vehementes hablen de un libro y lo recomienden a otros que también lo descargan, mejor, siempre y cuando uno tenga los ejemplares físicos para venderle a los conversos que lo quieren para sí, o para regalarlo a la tía María, o para tenerlo en su biblioteca, porque ¿quién sabe si el archivo digital seguirá siendo legible dentro de 20 años? 
     Las redes sociales y la posibilidad del descubrimiento
    En mi condición de autora, he publicado con editoriales grandes y pequeñas. HarperCollins, Avalon, Running Press, etc. En la mayoría de ellas, los departamentos de promoción no querían mi participación. La actitud era que si el autor participaba podía, de alguna manera, "malograr" los esfuerzos del publicista.
    Pero, ¿adivinen qué? Ahora que el espacio dedicado a recensiones ha disminuido drásticamente, a menos que se tome en cuenta a los blogs, el publicista necesita lugares y caras nuevas para el lanzamiento de los libros. Y los blogueros no quieren ni oír hablar del brazo propagandístico de las grandes grandes corporaciones. Quieren escuchar al autor. Así, de repente, el autor es alguien a quien hay que poner en juego para acercarse a los blogs y a los websites y conseguir menciones y reseñas.
Estamos viendo el despertar de las Giras de Blog. El autor escribe una serie de ensayos cortos y algunos artículos de opinión relacionados con el libro que los publicistas están promoviendo y los postean como "bloguero invitado" en sitios de mucho tráfico, siempre con enlaces a la página del autor y un botón de ¡Cómpralo ahora! vinculado al libro.
     ¡Editores!, provean a sus autores con ese pequeño trozo de código HTML. Solían equiparlos con una gacetilla de prensa y la cubierta del libro para que las repartieran. Hoy, denles el botón de ¡Cómpralo ahora!
     Esto implica más trabajo para el autor, por supuesto, y cada tanto oímos quejas en ese sentido: "Ya escribí el libro, ¿ahora tengo que promocionarlo? ¿Acaso no es el trabajo del editor?" Pero la pura verdad es que la mayoría de los autores quiere participar en la promoción y el márketing de sus libros y ya es tiempo de que los editores aprovechen esas energías. (Y no me malinterpreten: los autores todavía necesitan de los editores. Podría dar una charla entera sobre el tema).
      Lo anterior significa que el autor debe tener su propia página o blog, su página de fans en Facebook, su feed en Twitter, etc.
      Si el autor publica su primera novela, tal vez no haya construido todavía una comunidad de seguidores en las redes sociales, pero la situación cambia si el escritor es experto en alguna materia y no escribe ficción. La posibilidad de que tenga un grupo de gente que lo sigue en las redes a causa del tema y que, a su vez, participa en otros grupos y organizaciones, es alta. Y hasta los novelistas, si se han dedicado a algún tipo de género, es probable que hayan escrito cuentos, asistido a convenciones y otros eventos por el estilo, que los ponen en contacto con sus lectores potenciales. Quienes lo siguen serán los primeros en descargar su libro en cuanto el autor active el enlace ¡Cómpralo ahora!
Los autores duchos en las dinámicas de las redes sociales superarán el escollo más rápido, porque están "allí", donde los pueden ver y descubrir. Deberían ser googleables. A medida que pase el tiempo, estas cualidades se volverán tanto o más deseables para los editores que la verdadera habilidad para escribir del autor.
      Y aunque, por supuesto, en un año y medio o dos, este paisaje podrá ser completamente distinto, no veo que ninguna de estas tres dificultades se vaya a superar en el corto plazo. La capacidad de ser descubierto ha sido siempre uno de los grandes retos para los autores (fíjense si no en La vida de Pi, de Yann Martel, que vendía una miseria hasta que consiguió el Premio Booker, después de lo cual vendió 7 millones de ejemplares) y para los editores que tratan de imponer autores nuevos y nuevas ideas.
      Lo fue antes de la era digital y los seguirá siendo a medida que aparezcan nuevos dispositivos de lectura y nuevas formas de consumir literatura."

Para la versión original en inglés de este artículo, dirigirse a la página de Digital Book World.

Entrada publicada por Julieta Lionetti en Libros en la nube
Share/Save/Bookmark

lunes, 26 de abril de 2010

Lingüística computacional (1)



Introducción
Arte que emplea como medio de expresión una lengua.
Así define la RAE la literatura. Y queda meridianamente claro que el lenguaje y la palabra son el corazón de toda literatura, por encima de otros aditamentos artísticos que pudieran unírsele.

En la literatura digital, por tanto y en cuanto que es literatura, el tratamiento del lenguaje es fundamental. Y en cuanto que digital, el que ese tratamiento sea informatizado es asimismo básico.

Deberíamos convenir, entonces, que el análisis lingüístico por medio del ordenador debería ser una disciplina importante dentro de la literatura digital. En la práctica, sin embargo, esto está bastante lejos de ser realidad.

Por un lado, tenemos la literatura digitalizada que no precisa ningún tipo de tratamiento informático del lenguaje. En este ámbito, los bits que representan las palabras no tienen significado semántico. O bien son bits que representan un gráfico, un color (como en los textos escaneados) o bien son una transcripción a código binario de un texto pero en el que los elementos definitorios del lenguaje se han perdido. En un e-book, el código binario 0100 0001 0100 1101 0100 1111 0101 0010 es interpretado por el microprocesador para que active determinados pixeles en pantalla que muestren la palabra AMOR. Pero el software no sabe que se trata de un sustantivo, de género masculino, que puede unirse a un determinante y ser sujeto de un verbo, ni mucho menos el sentimiento que esa palabra nos evoca ni las metáforas que pueden imaginarse a partir de la misma.

En segundo lugar tenemos la literatura digital en donde el texto necesita de ciertos algoritmos que permitan viajar a través de la historia o mostrar las letras de un modo imposible sobre papel. El ordenador maneja los códigos de manera similar al caso anterior, sólo que los programas que los modifican no se limitan a visualizarlos sino que pueden mezclarlos, detectar acciones interactivas sobre ciertas zonas de pantalla, etc. Pero el ordenador sigue sin saber qué significan las palabras, las frases y, en la mayoría de los casos, incluso si estas están bien construidas. Ciertamente, existen algoritmos narrativos que permiten generar frases correctas pero están fundamentados en que un humano ha determinado un orden muy estricto de palabras y ha seleccionado un corpus muy restringido de ellas que pueden encajar en los moldes creados. Ejemplos de este tipo pueden verse
aquí y aquí.

Para ir más allá, para lograr que un ordenador pueda generar buena literatura se precisa modelar el lenguaje, del mismo modo que nuestro cerebro lo hace. No existe, hoy por hoy, un programa capaz de manejar el idioma como lo hace un ser humano. Pero sí existe una disciplina que lo intenta: la lingüística computacional que analiza la aplicación de los ordenadores al estudio científico del lenguaje.

Es una materia compleja que muchas veces suele encuadrarse dentro del campo de la Inteligencia artificial, algo bastante razonable dado que si algo caracteriza al ser evolucionado e inteligente es precisamente el habla. Como fin último se trataría de incorporar en el software de los ordenadores la habilidad en el uso del lenguaje, tanto desde el punto de vista de expresión como del de comprensión.

La lingüística computacional y la informática lingüística (quizá son malos neologismos que provienen del inglés linguistic computing y computational linguistic, pero ampliamente aceptados en cualquier caso) no sólo serían útiles en la consecución de una literatura digital de gran calidad. De hecho, si sólo fuera esta su utilidad probablemente no habría tanta actividad en torno a las mismas. Una transcripción formal del lenguaje en algoritmos permitiría, entre otras cosas, tareas como:

- Traducción automática de textos entre cualquiera de los idiomas del planeta, una aplicación anhelada por los organismos internacionales.
- Enseñanza de idiomas (si se consiguieran comprender los mecanismos profundos del lenguaje como para plasmarlos en algoritmos, posiblemente esas mismas deducciones servirían para poder aprender lenguas de modo rápido).
- La logopedia.
- El análisis sintáctico avanzado.
- La comprensión de las preguntas escritas que un usuario haga a un ordenador (algo que la
web 3.0 pretende a largo plazo).
- La generación de respuestas con sentido y razonadas.
- La conversación interactiva con una máquina (HAL sigue presente).
- Los procesos de archivo y documentación de textos.
- La edición de textos antiguos.
- El análisis de textos.
- Lexicografía.
- Análisis semántico.
- Reconocimiento del habla. Que un ordenador entienda lo que decimos y sepa interpretarlo correctamente. Aquí, podemos recordar una escena célebre de Star Trek en la que Scotty retrocede en el tiempo hasta nuestra época y su primera ocurrencia es hablar con el ordenador, no usar el ratón o teclear.
- Síntesis fonética, es decir que el ordenador nos hable en vez de mostrarnos texto, algo evidentemente útil para ciertas discapacidades.
- Escritura automática de textos técnicos a partir de bases de datos. Por ejemplo, una computadora ha podido realizar un exhaustivo análisis por el método de los elementos finitos de las solicitaciones estructurales del casco de un submarino. Sin embargo, hoy en día, el informe que muestre los resultados y los interprete será escrito por una persona. Podría pensarse que fuera el propio ordenador el que lo hiciera a partir de sus propios cálculos.
- Escritura de textos literarios que sean capaces de rivalizar con los escritores de carne y hueso.

En algunas de estas actividades se ha avanzado con notable éxito. Por ejemplo, la síntesis fonética puede darse casi por conseguida ya que existen programas que son capaces de pronunciar correctamente un texto escrito en diversos idiomas. Se usan, por ejemplo comúnmente en aeropuertos para dar anuncios. He escrito “casi” porque aún no pueden simular las emociones y los sonidos suenan un tanto mecánicos, demasiado iguales, con las pausas siempre en el mismo lugar aún cuando no procedan, sin pasión alguna.

Asimismo, el análisis de textos puede llevarse a cabo con gran eficacia si los textos han sido previamente categorizados. Si, por ejemplo, cada palabra individual de un libro ha sido etiquetada con atributos de manera que se almacenen, junto al propio código de la palabra, otros que definan si es adjetivo o adverbio, sustantivo o verbo, su género, si es plural o singular, nombre propio o común, a qué idioma pertenece, su etimología o cualquier otra categoría morfosintáctica que deseáramos, sería posible escribir un algoritmo que utilizara todos esos datos. Podríamos, por ejemplo, preguntar al ordenador cuántos sustantivos terminados en ced aparecen en La Celestina por poner el caso. Y, posteriormente, podríamos analizar cuántos de esos mismos sustantivos aparecen en El Quijote y comparar los modos y estilos de Rojas y Cervantes. O podríamos saber si un escritor determinado usa más o menos una palabra determinada, o en que contexto, o si repite frases a lo largo de su obra. Esto puede ya hacerse hoy en día si bien requiere de un trabajo de categorización previa que, en muchos casos, resulta titánico porque la codificación es básicamente humana.

Si, además, este corpus etiquetado morfológicamente lo está también sintácticamente, las posibilidades se multiplican.

Mas, en general, lo que queda por estudiar y descubrir representa aún un vasto territorio, lleno de oportunidades y retos. Y el vehículo que nos ha de permitir avanzar en ese desconocido universo es la lingüística computacional.

Iremos viendo retazos de la misma en próximos capítulos.



Entrada publicada por Félix Remírez en Biblumliteraria



Share/Save/Bookmark
Related Posts Plugin for WordPress, Blogger...