<html><head><style type="text/css">
#header {
position: relative;
width: 100%;
height: auto;
top: 0;
bottom: auto;
right: 0;
left: 0;
margin-left:0px;
        margin-bottom:30px;
padding:0px;
}
#footer {
position: relative;
width: 100%;
height: auto;
top: auto;
bottom: 0;
right: 0;
left: 0;
margin-top:50px;
margin-bottom:50px;
}
#resenaDiv {
        margin-left:20px;
        margin-right:20px;
        text-indent:0in;
        text-align:left;
        font-weight:normal;
        text-decoration:none;
        font-variant:normal;
        color:#000000;
        font-size:0.9em;
        font-style:normal;
        widows:2;
        /*font-family:'Times New Roman';*/font-family:  Arial, Verdana,
Helvetica, sans-serif;
        /*font-size:0.85em;*/
}


table {
}
td {
        border-collapse:collapse;
        text-align:left;
        vertical-align:top;
}
/*p, h1, h2, h3, li {
        color:#000000;
        font-family:'Times New Roman';
        font-size:11pt;
        margin-bottom:10pt;
        text-align:left;
        vertical-align:normal;
}*/
/*p, h1, h2, h3, li {
        color:#000000;
        font-family:  Arial, Verdana, Helvetica, sans-serif;
        font-size:0.9em;
        margin-bottom:10pt;
        text-align:justify;
        vertical-align:normal;
}*/
#header p, h1, h2, h3 {
        color:#000000;
        /*font-family:'Times New Roman';*/font-family:  Arial, Verdana,
Helvetica, sans-serif;
        /*font-size:0.8em;*/
        margin-top:0px;
        margin-bottom:0px;
        text-align:left;
        vertical-align:normal;
}
#footer p, h1, h2, h3 {
        color:#000000;
        /*font-family:'Times New Roman';*/font-family:  Arial, Verdana,
Helvetica, sans-serif;
        /*font-size:0.8em;*/
        margin-top:0px;
        margin-bottom:0px;
        text-align:center;
        vertical-align:normal;
}
p.cita-larga {
        /*font-size:0.9em;*/
        margin-bottom:6pt;
        margin-left:0.3937in;
        text-align:justify;
}
p.superindice,p.endnote_reference {
        vertical-align:super;
        font-size:/*7pt*/0.6em;
}
span.superindice,span.endnote_reference {
        vertical-align:super;
        font-size:/*7pt*/0.6em;
}

p.texto {
        margin-bottom:6pt;
        text-align:justify;
}

p.footnote_text {
        /*font-size:0.9em;*/
}


p.notas {
        /*font-size:0.9em;*/
        margin-bottom:3pt;
        text-align:justify;
}

p.seccion {
        font-size:/*11pt*/1em;
        font-weight:bold;
        margin-bottom:6pt;
        text-align:justify;
}
p.titulo_notas {
        font-size:/*11pt*/1em;
        font-weight:bold;
        margin-bottom:12pt;
        margin-top:24pt;
        text-align:justify;
}
p.pie_de_pgina {
        /*font-size:0.8em;*/
        margin-top:0px;
        margin-bottom:0px;
        text-align:center;
}
p.bibliografia {
        margin-bottom:6pt;
        text-align:justify;
        text-indent:0.4924in;
}
p.titulo_referencias_bibliograficas {
        font-weight:bold;
        margin-bottom:12pt;
        margin-top:24pt;
}
p.titulo_resea {
        font-weight:normal;
        margin-bottom:36pt;
        /*margin-left:0.3937in;*/
        margin-left:2in;
        margin-right:0.4333in;
        text-align:justify;
}
p.encabezado {
        /*font-size:0.8em;*/
        margin-top:0px;
        margin-bottom:0px;
}

p.endnote_reference {
        font-size:0.6em;
        vertical-align:super;
}
span.cursiva {
        font-style:italic;
}
*.ABI_FIELD_page_number{
        display: none;
}
</style></head><body>INFOLING. Información global sobre
lingüística hispánica: <a href="http://infoling.org"
target="_blank">http://infoling.org/</a>
<br />
<br />Moderadores: Carlos Subirats (UAB), Mar Cruz (UB)
<br />Editoras: Paloma Garrido (U. Rey Juan Carlos), Laura Romero
(UB)
<br />Programación y desarrollo: Marc Ortega (UAB)
<br />Directoras de reseñas: Alexandra Álvarez (U. Los Andes,
Venezuela), Yvette Bürki (U. Bern), María Luisa Calero (U. Córdoba,
España)
<br />Asesores: Isabel Verdaguer (UB), Gerd Wotjak (U. Leipzig)
<br />Colaboradores: Antonio Ríos (UAB), Danica Salazar (UB)
<br />
<br />Con el apoyo de:
<br /><ul style="margin: 0;padding-left:15px;"><li
style="padding-bottom: 0px;padding-top:0px;">Editorial Octaedro: <a
href="http://www.octaedro.com/"
target="_blank">http://www.octaedro.com/</a>
<br /><li style=";padding-top:0px;padding-bottom: 0px;">Arco Libros:
<a href="http://www.arcomuralla.com/Arco/Shop/default.asp"
target="_blank">http://www.arcomuralla.com/Arco/Shop/default.asp</a></li></ul>
<br /><font style="font-size:90%">ISSN: 1576-3404 </font>
<br /><font style="font-size:90%">© Infoling 1996-2010. Reservados
todos los derechos</font>
<br />
<br /></br><hr /><b>Reseña:</b><br />
Enrique Arias, Andrés, ed. 2010. Diacronía de las lenguas
iberorrománicas. Nuevas aportaciones desde la lingüística de
corpus. Madrid /  Frankfurt:
 Iberoamericana / Vervuert<br /><b>Autor/a de la reseña:</b> F.
Javier Pueyo Mena<hr /><div id="resenaDiv" 
style="margin-left:20px;margin-right:20px;text-indent:0in;text-align:left;font-weight:normal;text-decoration:none;font-variant:normal;color:#000000;font-size:1em;font-style:normal;widows:2;font-family:
 Arial, Verdana, Helvetica, sans-serif;">
<div id="header"  style="position: relative;width: 100%;height:
auto;top: 0;bottom: auto;right: 0;left:
0;margin-left:0px;      margin-bottom:15px;padding:0px;"><p
class="encabezado"
style="font-size:1em;margin-top:0px;margin-bottom:0px;color:#000000;font-family:Arial,
Verdana, Helvetica, sans-serif;text-align:left;vertical-align:normal;"
awml:style="Encabezado" dir="ltr" style="text-align:left"><span
xml:lang="es-ES" lang="es-ES">Infoling, 20 de noviembre de
2010</span></p><p class="encabezado"
style="font-size:1em;margin-top:0px;margin-bottom:0px;color:#000000;font-family:Arial,
Verdana, Helvetica, sans-serif;text-align:left;vertical-align:normal;"
awml:style="Encabezado" dir="ltr" style="text-align:left"><span
xml:lang="es-ES" lang="es-ES">Director de reseñas para esta sección:
Carlos Subirats (UAB, España)</span></p><p class="encabezado"
style="font-size:1em;margin-top:0px;margin-bottom:0px;color:#000000;font-family:Arial,
Verdana, Helvetica, sans-serif;text-align:left;vertical-align:normal;"
awml:style="Encabezado" dir="ltr" style="text-align:left"><span
xml:lang="es-ES" lang="es-ES"><a
href="http://www.infoling.org/informacion/Review51.html"
target="_blank">http://www.infoling.org/informacion/Review51.html</a></span></p>
 </div>
  <div id="main">
   <div>
    <p class="nflng-tituloresea" awml:style="NFLNG-TITULORESEÑA"
dir="ltr"
style="text-align:justify;margin-bottom:24pt;margin-top:12pt;margin-right:0.4333in;margin-left:0.3937in"><span
xml:lang="es-ES" lang="es-ES"><br />F. Javier Pueyo Mena. Reseña de
<a href="http://infoling.uab.es/search/books/announce.php?ID=142"
target="_blank">Andrés Enrique. 2010 <i>Diacronía de las lenguas
iberorrománicas</i>. Madrid /  Frankfurt: Iberoamericana /
Vervuert</a></span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El volumen editado por Andrés
Enrique-Arias (UIB), presenta un conjunto de 21 trabajos que fueron
presentados en el </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Coloquio
Internacional sobre Corpus Diacrónicos en Lenguas
Iberorromances</span><span xml:lang="es-ES" lang="es-ES"> (Palma de
Mallorca, 2007). Tal y como se explica en el prefacio del editor, un
comité científico seleccionó los trabajos de entre las 32 ponencias
y las 11 conferencias invitadas presentadas en el Coloquio. El
volumen, por lo tanto, presenta una buena panorámica de la situación
del campo hasta la fecha en que se celebró el citado coloquio, aunque
debemos mencionar que los trabajos incluidos en el volumen han sido
revisados y reelaborados por los autores, por lo que podemos
conjeturar que las descripciones incluidas han sido debidamente
puestas al día.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El volumen se estructura en 6 partes que
tratan de agrupar los trabajos presentados por la orientación
temática principal de cada uno. Evidentemente todos los trabajos
podrían haberse incluido en otras de las secciones temáticas del
libro, ya que en casi todos los casos se describe un corpus en
concreto, se centra en una variedad romance determinada, y casi todos
reflejan una finalidad concreta más allá de la mera constitución de
los mismos. Quizá las divisiones temáticas podrían haber sido
menores o diferentes, pero salvo algunas excepciones que mencionaremos
más adelante, la adjudicación realizada por el editor a cada trabajo
nos parece adecuada, aunque el lector  interesado exclusivamente
en una de la áreas temáticas establecidas no debería excluir a
priori la consulta del resto de los trabajos, en los que seguramente
encontrará referencias interesantes sobre la misma.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">La primera parte titulada </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Cuestiones filológicas</span><span xml:lang="es-ES"
lang="es-ES"> incluye tres artículos que se centran principalmente en
el aspecto de la representación filológica de los textos durante la
fase de diseño de los corpus diacrónicos que se presentan. Aunque
los trabajos no pretenden sentar bases metodológicas o teorías
generalistas aplicables a todos los corpus históricos iberorromances,
sin embargo, al quedar dos de los trabajos inscritos dentro de la red
CHARTA las propuestas que podemos encontrar tienen una amplia
difusión en los grupos afiliados a dicha iniciativa. El trabajo «El
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Corpus de Documentos Españoles
Anteriores a 1700</span><span xml:lang="es-ES" lang="es-ES"> (CODEA)»
firmado por Pedro Sánchez-Prieto Borja, Florentino Paredes García,
Rocío Martínez Sánchez, Ruth Miguel Franco, María Simón Parra e
Irene Vicente Miguel, presenta y describe el corpus diacrónico CODEA.
Dada la trayectoria del grupo de investigación que desarrolla dicho
corpus, la propuesta central del trabajo la encontramos en la
necesidad de la triple presentación de los textos en sus ediciones
facsimilar, paleográfica y crítica. Si bien las dos primeras formas
de presentación permiten el análisis de fenómenos de escritura de
forma directa y la validación de las decisiones tomadas durante la
siguiente fase (presentación crítica), resultaría muy útil la
discusión e incoporación al corpus de algún mecanismo de consulta
que permita analizar paralelamente la presentación paleográfica y la
crítica para encontrar y analizar de forma automatizada los patrones
gráfico-fonéticos o morfológicos a lo largo de la historia del
español. Más allá de los problemas de representación, no deja de
ser interesante la discusión y justificación de las decisiones de
selección tipológica (priorización de los documentos
administrativos) y diatópica (lugar de emisión frente a lugar de
conservación). Como en la mayor parte de los trabajos recogidos en el
volumen nos encontramos en la fase inicial de desarrollo del corpus
por lo que la realización de estudios lingüísticos cuantitativos
sobre dicha colección no es posible de momento ya que, tal y como
describen los autores, no se ha realizado todavía ninguna marcación
lingüística (aunque se anuncia la próxima lematización de todo el
corpus) y todavía no es posible el acceso de otros investigadores a
los textos digitales.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El siguiente trabajo, «Los documentos
americanos (o indianos) en la red CHARTA», firmado por  Micaela
Carrera de la Red y por Miguel Gutiérrez Maté, describe de forma
más detallada el sistema de representación de textos antiguos
empleado en la red CHARTA y pasa después a valorar la aplicación de
dicho sistema a las peculiaridades de las fuentes de documentación
americanas. Si el propósito de CHARTA es el de crear un macro-corpus
a partir de las aportaciones de corpus particulares, resulta
fundamental que la presentación de los textos se haga de una forma
homogénea que permita el análisis lingüístico comparado entre
todos los sub-corpus que se integran en la red. Los autores muestran
la dificultad, pero no la imposibilidad, de alcanzar este objetivo al
incorporar a la red colecciones documentales de diferentes tradiciones
escrituarias. Esto es especialmente problemático en el ámbito
americano en el que algunos documentos se muestran ciertamente
conservadores en las tradiciones de escritura mientras que, otros,
reflejando una acusada variación fonética, son claramente
innovadores. Evidentemente muchos de los problemas de
interoperatibidad entre las colecciones que se incorporan a CHARTA se
pueden solucionar en las fases de lematización y marcación
lingüística de los textos, las cuales permitirían a los
investigadores interesados tanto en la lexicografía, como la
morfosintaxis históricas abstraerse de la complejidad en la
representación documental de la variaciones gráfica y fonética en
los textos antiguos.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El último trabajo incluido en esta
primera parte es el de Beatriz Arias, «Confección de un corpus para
conocer el origen, la evolución y la consolidación del español en
la Nueva España», en el cual se presenta una propuesta de diseño de
corpus para el estudio del origen y evolución del español de Nueva
España. En la primera parte del artículo se discuten los parámetros
de selección de los textos y su problemática, estudiando los niveles
diatópico (donde se propone la inclusión de textos tanto de las
diferentes áreas del Virreinato, como de aquella zonas de la
península de donde procedían las diferentes oleadas de pobladores de
Nueva España, así como la inclusión de las zonas de tránsito de
Canarias, Cuba o Filipinas), diastrático (se propone la
clasificación: españoles, criollos, mestizos, indígenas,
negros/mulatos y extranjeros), diafásico (registros formal,
semiformal e informal) y diacrónico (periodización en tramos de 25
años).  En la segunda parte del trabajo se explican
detalladamente los criterios de presentación de los textos,
utilizando, tal y como se proponía en el primer trabajo, un sistema
de tres formas de acceso a los mismos: facsímil, transcripción
paleográfica estrecha (que se refleja en la distinción de todas las
grafías, en el no desarrollo de las abreviaturas, etc.) y la versión
crítica normalizada. Al igual que decíamos en los casos anteriores
sería muy deseable alguna propuesta de uso paralelo de las dos
representaciones textuales de los documentos que conforman los
corpus.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">La siguiente sección del volumen
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Diseño de corpus para fines
específicos</span><span xml:lang="es-ES" lang="es-ES"> recoge tres
trabajos que describen las cuestiones de diseño de tres diferentes
corpus en relación con los usos concretos para los que se crean. El
primer artículo, «Un corpus para un Nuevo diccionario histórico del
español», firmado por José Antonio Pascual y Carlos Domínguez, da
cuenta del desarrollo del </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Corpus del
Nuevo diccionario histórico</span><span xml:lang="es-ES"
lang="es-ES"> de la Real Academia Española (CNDH). El trabajo nos
describe las decisiones de diseño que se han ido tomando para la
configuración de un corpus que contará inicialmente con cincuenta
millones de palabras. Se analizan particularmente las decisiones
tomadas bajo tres condicionantes particulares: los condicionantes
filológicos (decisiones de representación normalizada de los textos,
pero ajustadas al uso lexicográfico y la disponibilidad de ediciones
textuales adaptadas a dichos criterios de presentación), el uso
exclusivo del corpus por lexicógrafos, ya que su creación se motiva
como ayuda a la redacción de un diccionario histórico, y el
pragmatismo en el desarrollo de las diferentes fases de creación del
corpus (condicionadas por las necesidades de planificación del
diccionario y su complementariedad con otras fuentes de información
lexicográficas).</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El artículo de Joan Torruella, «Bases
científicas de la investigación a partir de corpus» expone las
cuestiones de diseño que han tenido en cuenta al diseñar el
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Corpus Informatitzat del Català
Antic</span><span xml:lang="es-ES" lang="es-ES"> (CICA), cuyo objetivo
concreto es la de servir de banco de datos para la realización de una
gramática histórica del catalán antiguo (del siglo XI al siglo
XVII). Si en el artículo anterior se insistía en la problemática
del diseño desde el punto de vista del lexicógrafo en este caso la
perspectiva se centra los problemas de diseño de un corpus que ayude
en la descripción y análisis de los aspectos morfosintácticos y
sintácticos de una lengua, en este caso del catalán antiguo. Sin
embargo, tal y como sugiere el título del artículo, el trabajo se
centra en la discusión de las bases teóricas del uso de un corpus
para la investigación lingüística y se hace una llamada de
atención a la necesidad de emplear rigurosamente las técnicas
estadísticas para sacar conclusiones científicas en la
investigación de problemas lingüísticos desde metodologías
cuantitativas. La segunda parte del artículo describe la
articulación del CICA en torno a los parámetros fundamentales sobre
los que se ha construido: el cronológico y el tipológico, aunque
explicando que se sigue evolucionando en un tercer parámetro: el
dialectal. De nuevo nos encontramos con un proyecto en el que se ha
avanzado sustancialmente en las fases de diseño e implementación
inicial, con la incorporación de los textos que lo conforman. Se
anuncia igualmente que el corpus esta en fase de lematización y
marcación gramatical, lo cual parece todavía más necesario dada la
declarada vocación de banco de datos para el análisis
morfosintáctico histórico del corpus.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo que presentan Ana
Stulic-Etchevers y Soufiane Rouissi, «Pensando un corpus en modo
colaborativo: hacia el prototipo del corpus judeoespañol digital»,
se centra en la fases previas de creación de un corpus específico
para la variedad del judeoespañol. En esta fase de planificación se
repasan las problemáticas más específicas para la digitalización
de textos judeoespañoles: desde el establecimiento y localización de
las fuentes textuales, pasando por la representación digital de la
aljamía hebraica, en la cual se ha expresado tradicional y
mayoritariamente esta variedad lingüística de forma escrita, hasta
las diferentes y enfrentadas normas de transcripción normalizada que
se emplean en el campo de la filología y estudios sefardíes, o la
necesidad de mostrar los documentos en edición facsimilar. La
propuesta más novedosa del trabajo, sin embargo, es la de la
creación del corpus del judeoespañol de forma colaborativa, no
solamente a la hora de aportar fuentes y documentos, sino dotándolo
de mecanismos de anotación que puedan compartirse con el resto de
investigadores e incorporarse al propio corpus. Dada la novedad de la
propuesta, las autoras presentan los resultados de una encuesta de
actitud realizada entre investigadores del campo para analizar las
prácticas actuales de los investigadores y detectar sus necesidades,
con la intención de adaptar el diseño del corpus a estas realidades.
Se preguntó sobre la utilización o no de recursos informáticos en
la investigación y sobre las prácticas reales de trabajo en modo
colaborativo, incluyendo el intercambio de los resultados obtenidos.
La conclusión a la que llegan las autoras es que los investigadores
consideran deseable y necesario el trabajo colaborativo, siempre que
se defina con claridad su alcance y significado. Quizá este artículo
hubiera estado mejor ubicado en la Sección IV sobre otras variedades
iberorromances, ya que no se describe en él ningún fin o uso
específico para la creación del futuro corpus del
judeoespañol.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">Los dos artículos contenidos en la
siguiente sección del volumen </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Cuestiones de
arquitectura informática</span><span xml:lang="es-ES" lang="es-ES">
(ambos en inglés) se centran particularmente en el apartado de
consulta o de explotación de los corpus diacrónicos. El trabajo de
Mark Davies, «Creating useful historical corpora...», realiza una
atinada comparación entre las posibilidades de aprovechamiento de dos
corpus realizados por él mismo: el </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Corpus del
español</span><span xml:lang="es-ES" lang="es-ES"> y el </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Corpus do português</span><span xml:lang="es-ES"
lang="es-ES">, en contraposición con el </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Corpus
diacrónico del español</span><span xml:lang="es-ES" lang="es-ES">
(CORDE) de la Real Academia Española. Si bien las críticas en los
aspectos analizados por el autor son comprobables y muy ciertas,
hubiera sido deseable que la contraposición de prestaciones se
hubiera realizado además con otros corpus no desarrollados por el
propio autor, para asegurar una cierta neutralidad en la elección de
las características analizadas, ya que podríamos plantearnos si el
autor ha seleccionado aquellas cualidades en las que las herramientas
de consulta de sus corpus destacan específicamente. En cualquier caso
lo que se pone de manifiesto es que el acceso total y sin límites de
los investigadores a los textos de un corpus es lo que permite que
dichos investigadores puedan desarrollar las prestaciones que ellos
consideren adecuadas para la explotación del corpus. Si es innegable
que la implementación de los corpus de Davies ofrecen posibilidades
de consulta que CORDE incomprensiblemente no ofrece (tanto a nivel
léxico, como morfosintáctico, como semántico, tal y como nos va
demostrando el autor), no deja de ser cierto que ninguna herramienta
de consulta puede ofrecer todas las posibilidades de consulta, ni
todas las marcaciones necesarias, ni todas las pruebas o descripciones
estadísticas deseadas para estudios específicos (especialmente los
más novedosos), por lo que es deseable siempre la publicación y
distribución de los corpus en formatos estándar que permitan a otros
investigadores desarrollar sus propias herramientas de trabajo para el
análisis de global de los textos.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El siguiente trabajo «Using
non-annotated diachronic corpora: benefits, methods and limitations»
firmado por Kim Schulte, muestra precisamente que aún sin contar con
herramientas de consulta incorporadas a un proyecto de corpus, el
acceso a los textos permite a los investigadores un aprovechamiento
adaptado a las especificaciones de la investigación concreta que se
quiere realizar. El uso de expresiones regulares (mediante la utilidad
informática </span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">egrep</span><span xml:lang="es-ES"
lang="es-ES">) en el que se centra el trabajo es solo una de la
maneras de extraer información de un corpus, a cuyos textos se tiene
acceso, pero que carece de marcación lingüística o de herramientas
de consulta. Si bien el trabajo se plantea en torno a la problemática
de la ausencia de marcación o de marcación insuficiente para la
realización de una investigación particular, no deja de ser
interesante la combinación del acceso a los textos que sí poseen
dicha marcación, incorporándola en las expresiones regulares que
vayamos a diseñar. Igualmente el uso de lenguajes de programación,
que incorporan expresiones regulares, para el tratamiento de los
textos de un corpus o de programas de tratamiento estadístico
avanzado, abren al investigador muchas otras opciones que las
limitaciones de utilidades como </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">egrep</span><span xml:lang="es-ES" lang="es-ES"> no
permiten y que pueden solventar en buena medida las limitaciones y
dificultades que la autora discute al final del trabajo.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">La siguiente sección </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Corpus y variedades iberorromances</span><span
xml:lang="es-ES" lang="es-ES"> reúne cinco trabajos dedicados a la
descripción de corpus y otros recursos electrónicos de variedades
iberorromances distintas del castellano. Xulio Viejo, Arsenio Coto,
María Cueto y Roberto Hinojal presentan el desarrollo del corpus
ESLEMA (</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Corpus Xeneral de la Llingua
Asturiana</span><span xml:lang="es-ES" lang="es-ES">). Resulta de
particular interés la discusión inicial sobre la problemática de a
qué consideramos variedad asturiana (sometida desde muy temprano a
una intensa presión lingüística y cultural por parte del
castellano) y en concreto qué consecuencias de una definición
estrecha o abierta tiene en la selección de los documentos que
conforman el corpus. Nos parece muy adecuada la postura de un diseño
abierto que recoja tanto los documentos híbridos latino-romances como
los híbrido astur-castellanos, siempre y cuando, tal y como sugieren
los autores, se siga un modelo de marcación que delimite en lo
posible las variedades incluidas (que en ESLEMA se denominan asturiano
nuclear, asturiano híbrido y asturiano periférico). Según la
descripción de los autores el corpus se compone de tres subcorpus: el
medieval, el clásico y el actual. Aunque los tres se encuentran en
fase de desarrollo, solamente el último, con 8 millones de palabras,
se encuentra disponible en la actualidad para su consulta. Para este
subcorpus actual se anuncia una marcación lingüística (morfológica
y sintáctica) a corto plazo. Son destacables también las iniciativas
del grupo de investigación en su vertiente comunitaria, con la
creación de un modelo colaborativo para la recolección de los datos
y la aplicación del corpus en iniciativas de alcance social como la
creación de un traductor asturiano/castellano dentro del proyecto
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Apertium</span><span xml:lang="es-ES"
lang="es-ES">, una plataforma abierta de traducción
automática.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo de Ricardo Pichel y Xavier
Varela Barreiro presenta el </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Tesouro
Medieval Informatizado da Lingua Galega</span><span xml:lang="es-ES"
lang="es-ES">, un subcorpus del gallego medieval integrado en el
proyecto </span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Tesouro Medieval
Galego-Portugués</span><span xml:lang="es-ES" lang="es-ES"> donde se
reúnen documentos producidos tanto en Galicia como en Portugal en
gallego, portugués, latín y castellano durante la Edad Media. El
trabajo presenta en detalle tanto la estructura tipológica (textos
notariales, prosa no notarial y lírica), como geográfica del corpus.
Especialmente destacable es la presentación de las cabeceras
utilizadas para la identificación y descripción de los 16000
documentos incluidos en el corpus y la ejemplificación en uno de los
documentos de la nueva DTD que se ha desarrollado, cuyo nivel de
detalle y precisión es, sin duda, muy avanzado y permitirá a los
investigadores establecer distinciones muy ajustadas a la hora de
seleccionar o comparar los miles de documentos que conforman el
corpus. Finalmente se anuncia que se ha iniciado ya el proceso de
lematización y etiquetado morfosintáctico del corpus, además de la
marcación de entidades onomásticas (topónimos, antropónimos,
títulos de obras. nombres de días, de meses, de instituciones,
etc.).</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo de Aitor García Moreno «El
proyecto de edición del fichero manuscrito de léxico judeoespañol
de Cynthia Crews», describe la fase inicial del proyecto de
digitalización del fichero manuscrito lexicográfico judeoespañol de
la investigadora británica Cynthia Crews. Si bien no se trata de un
corpus textual para el análisis lingüístico del judeoespañol, la
disponibilidad de este recurso electrónico (35.000 papeletas con
información sobre fuentes, grafías, fonética, léxico,
etimologías, y numerosos fenómenos lingüísticos, recogidos durante
décadas de investigación en numerosos puntos de la geografía
sefardófona) supondrá una fuente primordial de información que
permitirá, sin duda, avanzar en la futura constitución, tal y como
propone el autor, del </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Tesoro
lexicográfico judeoespañol</span><span xml:lang="es-ES"
lang="es-ES"> o, por qué no, de herramienta de diseño y desarrollo
de un muy necesario </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Corpus
histórico del judeoespañol</span><span xml:lang="es-ES"
lang="es-ES">. Dada la especificidad del proyecto expuesto,
seguramente este artículo podría haberse incluido de forma más
coherente en la Sección II sobre recursos con un fin específico y
haber trasladado a esta sección de variedades diferentes al
castellano el trabajo de Stulic-Etchevers y Rouissi, que discute las
problemáticas concretas de digitalización de fuentes sefardíes,
para no dejar al judeoespañol sin representación en esta
sección.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo de Miguel Calderón Campos y
María Teresa García Godoy describe el proyecto </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Corpus diacrónico del español del Reino de
Granada</span><span xml:lang="es-ES" lang="es-ES"> (</span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">CORDEREGRA</span><span xml:lang="es-ES" lang="es-ES">).
Después de justificar los criterios cronológicos (1492-1833),
geográficos (para la modalidad oriental del andaluz, las actuales
provincias de Granada y Málaga; para la modalidad occidental, la
provincia de Almería), y textuales (documentos archivísticos:
cartas, memoriales, testamentos, inventarios, etc.) empleados en la
selección de los documentos integrados en el corpus, los autores
realizan una interesante ejemplificación del uso del corpus, mediante
el análisis de dos fenómenos de variación lingüística en el siglo
XVIII (yeísmo y pérdida de /d/ intervocálica) y la reconstrucción
del sistema de tratamiento en el siglo XVII (formas de </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">tú</span><span xml:lang="es-ES" lang="es-ES">,
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">vos</span><span xml:lang="es-ES"
lang="es-ES"> y </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">usted</span><span xml:lang="es-ES" lang="es-ES">),
posible gracias a la incoroporación al corpus de tipologías
textuales que contienen pasajes en estilo directo. </span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo de Mercedes Abab Merino «Uso
de corpus documental en sociolingüística histórica y retos para su
elaboración en el sureste peninsular», resulta de particular
interés ya que se adentra en un área ciertamente compleja y difícil
de establecer en la investigación en lingüística histórica: las
variables sociolingüísticas y su plasmación e identificación en
las fuentes documentales antiguas. Se centra el artículo, por lo
tanto, en la problemática de la selección de textos,
específicamente para los siglos XVI y XVII. La autora realiza una
propuesta concreta de tipología textual adecuada para el análisis de
variables sociolingüísticas (libros de correspondencia, cuentas de
mayordomo, libros de cámara, libros de fábrica de iglesia, pleitos)
y la ejemplifica con documentos obtenidos en los archivos del antiguo
Reino de Murcia. El trabajo incorpora la propuesta concreta de la
autora para establecer a partir de la tipología textual elegida, los
marcadores socio-situacionales que pueden usarse como variables
sociales y estilísticas de la época que abarca el corpus: fecha,
localización, autor/emisor, sexo, profesión, nivel cultural y grupo
social.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">La siguiente sección </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">La Biblia como corpus</span><span xml:lang="es-ES"
lang="es-ES"> es un monográfico sobre el uso de las traducciones
bíblicas medievales en castellano como un corpus lingüístico
independiente. Se justifica la decisión editorial de agrupar los
trabajos sobre textos bíblicos en una sección propia por la
característica especial del corpus </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Biblia
Medieval</span><span xml:lang="es-ES" lang="es-ES"> (que es al que se
refieren las tres contribuciones seleccionadas en este apartado) y de
los trabajos realizados sobre dicho corpus, al tratarse de un corpus
paralelo en el que se recogen las distintas versiones medievales
castellanas y sus fuentes originales. En el trabajo «Ventajas e
inconvenientes del uso de </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Biblia
medieval</span><span xml:lang="es-ES" lang="es-ES"> (un corpus
paralelo y alineado de textos bíblicos) para la investigación en
lingüística histórica del español», Andrés Enrique-Arias,
director de dicho corpus, analiza de forma crítica las ventajas e
inconvenientes de trabajar con un corpus paralelo y alineado (al nivel
de versículo bíblico), para explorar fenómenos de variación
morfosintáctica a lo largo de la historia del castellano. Como
destaca el autor una de las ventajas de tratar con textos de
traducción (de los que se conserva la fuente de traducción original)
es que se puede averiguar de forma objetiva el significado que el
traductor buscaba al emplear un término o una construcción
sintáctica. La desventaja reside, por supuesto, en que al tratarse de
una traducción es muy posible que el uso de algunas estructuras esté
condicionado por su presencia en la lenguas originales, aunque es muy
cierto que este problema se presenta en muchos de los textos
medievales que vayamos a usar en la construcción de cualquier otro
corpus diacrónico, ya que mucha de la producción en lengua
castellana medieval representan traducciones o adaptaciones de textos
originados en otras lenguas. El conocer el texto subyacente, sin
embargo, nos permite controlar de forma más segura este tipo de
fenómenos de transferencia. No cabe duda que el poder observar la
evolución de la misma estructura subyacente a lo largo de la historia
del español es una ventaja adicional, ya que los testimonios
bíblicos conservados, traducidos independientemente, presentan gran
fidelidad al texto original que traducen y son más fácilmente
comparables unos con otros (siempre y cuando se haya realizado la
labor de alineación, al menos al nivel de la unidad más relevante en
este tipo de textos: el versículo). Más allá del problema del uso
de traducciones para el análisis lingüístico el autor analiza otros
parámetros que pueden resultar limitados en el uso de una sola
tipología textual. Respecto a la diversidad estilística, reconoce el
autor que corpus más generalistas como el CORDE o el </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Corpus del español</span><span xml:lang="es-ES"
lang="es-ES"> pueden ofrecer una representación mayor de estilos,
pero que la propia diversidad del texto bíblico (pasajes narrativos,
diálogo, lírica, lenguaje profético, fragmentos legislativos, etc.)
permite controlar una cantidad considerable de registros, géneros y
estilos. Respecto a la representatividad del registro bíblico para
extraer conclusiones sobre la situación del castellano medieval, de
nuevo nos encontramos ante el razonamiento de que es un problema
compartido por todos los textos medievales, sean notariales,
literarios o pertenecientes a cualquier otra tipología o tradición
discursiva medievales. El autor reconoce la dificultad de establecer
la representatividad de cualquier fuente documental medieval, incluida
la Biblia, aunque destaca que el estilo narrativo y directo de
numerosos pasajes bíblicos permiten suponer una mayor naturalidad
lingüística que en otras tipologías textuales. Otro de los
problemas que destaca el autor es el del estado actual de
representación del corpus (edición paleográfica de todos los
textos, sin normalización, lematización o etiquetación gramatical),
por lo que su uso exige el conocimiento de las posibles grafías
empleadas en cada época. En cualquier caso, esta desventaja es
temporal ya que se anuncia que los tres procesos mencionados se
acometerán en una segunda fase del corpus. </span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo de Valentina Vincis
«Describir textos a partir de estructuras de ilación oracional: un
corpus de romanceamientos bíblicos medievales», hace uso
precisamente del corpus </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Biblia
medieval</span><span xml:lang="es-ES" lang="es-ES"> y muestra las
posibilidades de dicho corpus en las dos vertientes discutidas por
Enrique-Arias en el trabajo anterior: una horizontal, es decir, la
identificación de tradiciones discursivas (géneros narrativo,
profético, lírico) dentro de la variedad estilística y temática
del texto bíblico; y la otra vertical, es decir,  controlando la
estructura en estudio en los mismos contextos discursivos ofrecidos
por todos los códices incluidos en el corpus. El estudio se centra en
el análisis y comparación estadística de estructuras de ilación
oracional y llega a dos conclusiones generales: primero, que en el
plano horizontal, hay una relación  entre las tradiciones
discursivas examinadas y la forma lingüística analizada, y segundo,
que en el plano vertical, aún siendo ciertamente relevante la fuente
original de las traducciones analizadas (latín o hebreo) para la
estructura que se estudia, el análisis comparado de las versiones
permite detectar variaciones individuales relevantes, incluso en
aquellos textos traducidos a partir del mismo texto
subyacente.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El último trabajo de esta sección,
«Notas sobre los nexos concesivos en los romanceamientos bíblicos
medievales», firmado por Lola Pons, utiliza de nuevo los textos del
corpus bíblico </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Biblia
Medieval</span><span xml:lang="es-ES" lang="es-ES"> para estudiar la
evolución de los nexos concesivos (</span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">maguer</span><span xml:lang="es-ES" lang="es-ES">,
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">aunque</span><span xml:lang="es-ES"
lang="es-ES">, </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">ya sea
que</span><span xml:lang="es-ES" lang="es-ES">, </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">non embargante</span><span xml:lang="es-ES"
lang="es-ES">, etc.) a lo largo de la Edad Media. En el artículo se
hace uso de una de las ventajas destacadas por Enrique-Arias a la hora
de usar un corpus paralelo de traducción del que se conoce
exactamente el texto subyacente:  la autora ha localizado una
estructura concesiva en el texto bíblico latino (</span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">etiamsi</span><span xml:lang="es-ES" lang="es-ES">) y ha
podido examinar de forma exhaustiva cómo dichas estructuras se han
traducido en dos versiones bíblicas, la una del siglo XIII (E6/E8) y
la otra del XV (</span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Biblia de
Alba</span><span xml:lang="es-ES" lang="es-ES">). La principal
conclusión a la que se llega es que ya en el siglo XV </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">maguer</span><span xml:lang="es-ES" lang="es-ES"> ha
desaparecido prácticamente en su función de nexo concesivo y que
además se encuentra una mayor variedad de nexos consecutivos en el
siglo XV que en el XIII.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">Tal y como se especifica en el subtitulo
del volumen </span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Nuevas aportaciones desde la
lingüística de corpus</span><span xml:lang="es-ES" lang="es-ES">,
además de recogerse aquí todas la contribuciones que detallan la
constitución y problemáticas concretas de los corpus diacrónicos
que se están gestando, se incluyen algunos trabajos (además de los
dos dedicados al tema bíblico que hemos visto anteriormente) en los
que se utilizan algunos de los corpus disponibles para abordar casos
de estudio concretos de lingüística histórica desde la nueva
perspectiva que pueden aportar los estudios cuantitativos o
estadísticos. Los cinco artículos recogidos en esta sección,
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Aplicaciones del uso de corpus en la
historia del español</span><span xml:lang="es-ES" lang="es-ES">,
cierran el volumen.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">En el primero, Robert Blake y Gina Lee
describen la utilidad MOCA, un programa en red para el análisis
textual de documentos. Los autores aplican la herramienta a un
conjunto de textos diplomáticos de los siglos IX al XII del
Monasterio de Sahagún, y lo cierto es que a lo largo del artículo se
denomina MOCA tanto a la herramienta de análisis utilizada, como al
propio corpus documental. Si bien, a nuestro entender, la herramienta
examinada es demasiado generalista para el análisis particular de un
corpus, lo cierto es que permite a quienes carecen de otras
alternativas o de desarrollos computacionales propios acercarse
estadísticamente a la descripción de colecciones documentales
(frecuencias y pruebas representatividad de los cálculos numéricos).
En el caso concreto expuesto por los autores, el uso de la herramienta
se circunscribe a la búsqueda dentro del corpus de las formas
léxicas y construcciones sintácticas analizadas ya que, dadas las
características gráficas de los documentos, no se han podido
aprovechar las posibilidades de lematización y marcación sintáctica
que ofrece. En cualquier caso, resulta de mucho interés la discusión
sobre los problemas de interpretación léxica y sintáctica
condicionados por la escritura logográfica e híbrida latino-romance
habitual en los textos producidos antes de las regularizaciones
gráficas que se fueron perfilando a lo largo del siglo XIII. Los
autores se centran en la discusión teórica y la ejemplificación
cuantitativa de variantes gráficas de algunos términos como
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">rivus, carraria, terra</span><span
xml:lang="es-ES" lang="es-ES"> o</span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">
ripa</span><span xml:lang="es-ES" lang="es-ES"> y de las
construcciones con clíticos (interpolación, enclisis, proclisis) en
el estado de lengua y de representación gráfica tempranas del corpus
analizado.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">Aprovechando las magníficas
posibilidades para el análisis colocacional que ofrece la interfaz de
consulta del </span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">Corpus del español</span><span
xml:lang="es-ES" lang="es-ES">, el artículo de Josep Alba Salas «Las
estructuras tipo </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">meter
miedo</span><span xml:lang="es-ES" lang="es-ES"> en diacronía: más
detalles sobre la evolución histórica de las colocaciones
causativas»,  analiza la evolución histórica de colocaciones
causativas (</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">meter/poner</span><span xml:lang="es-ES"
lang="es-ES"> + </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">miedo/celos/dolor/envidia</span><span xml:lang="es-ES"
lang="es-ES">, etc.) desde el siglo XIII hasta la actualidad y
contrapone sus resultados a los obtenidos en trabajos anteriores del
mismo autor para las colocaciones con </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">hacer</span><span xml:lang="es-ES" lang="es-ES"> y
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">dar</span><span xml:lang="es-ES"
lang="es-ES">. El autor ofrece la distribución detallada y la
evolución de ambos verbos con los 12 sustantivos analizados. Dado que
el autor propone que la distribución a lo largo del tiempo y con
diferentes sustantivos de </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">meter</span><span xml:lang="es-ES" lang="es-ES"> y
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">poner</span><span xml:lang="es-ES"
lang="es-ES"> pudo haberse visto influenciada por el avance de las
estructuras colocacionales con </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">dar</span><span xml:lang="es-ES" lang="es-ES"> (y no por
los mismos aspectos sociolingüísticos que pueden explicar la
competencia de </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">hacer</span><span xml:lang="es-ES" lang="es-ES"> y
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">dar</span><span xml:lang="es-ES"
lang="es-ES">), quizá hubiera sido deseable un reanálisis conjunto
de todas las estructuras causativas para mostrar cuantitativamente
estas interacciones.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">Usando CORDE, el otro gran corpus
disponible para el estudio de la diacronía del español, Dorien
Nieuwenhuijsen, en el trabajo titulado «El rastreo del desarrollo de
algunos pronombres personales en español: (im)posibilidades de los
corpus diacrónicos digitales», estudia la evolución de algunas
formas pronominales de segunda persona (</span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">vosotros</span><span xml:lang="es-ES" lang="es-ES">
frente a </span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">vos</span><span xml:lang="es-ES"
lang="es-ES"> y </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">con
vos</span><span xml:lang="es-ES" lang="es-ES"> frente a </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">conbusco</span><span xml:lang="es-ES" lang="es-ES">) y la
evolución de la forma átona </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">vos</span><span xml:lang="es-ES" lang="es-ES"> a
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">os</span><span xml:lang="es-ES"
lang="es-ES">. El título puede llevar a engaño si se espera que la
autora realice un análisis teórico de las ventajas y desventajas del
análisis lingüístico sobre corpus textuales. En realidad nos
encontramos ante la evaluación del uso de un corpus en particular, el
CORDE, y de sus herramientas de consulta. Los pros y contras
enumerados por la autora, no pueden extrapolarse a otras colecciones
documentales (recordemos que, por ejemplo, el </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Corpus del español</span><span xml:lang="es-ES"
lang="es-ES"> sí está lematizado y marcado gramaticalmente, aunque
de forma parcial, y su herramienta de consulta da acceso a la
búsqueda de lemas y etiquetas gramaticales) y ni siquiera al propio
CORDE como corpus, siempre y cuando fuera distribuido abiertamente y
pudieran desarrollarse otras herramientas de consulta y marcación
alternativas a las que la Real Academia Española ofrece. Sí resultan
más generalizables dos de los problemas destacados por la autora y
que son inherentes a las fuentes usadas por los diferentes corpus
diacrónicos: primero, la datación de las fuentes según su fecha de
creación intelectual o material (que puede muy bien solucionarse
aportando ambas, cuando se conocen, en la descripción de los
documentos y permitiendo seleccionar los textos en base a ambas
dataciones) y, segundo, la dependencia del investigador de las
decisiones de representación adoptadas por el grupo que desarrolla el
corpus (específicamente para este trabajo, la unión y separación de
palabras o la acentuación de las formas pronominales tónicas).
Lógicamente quien desarrolla un corpus tiene la obligación de tomar
dichas decisiones de acuerdo a los propósitos y consideraciones
teóricas del proyecto. De nuevo, solamente la disponibilidad abierta
de los corpus permitirá a otros investigadores tomar sus propias
decisiones, adaptadas al uso concreto que quiere realizar del
corpus.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">El trabajo de Natalya Stolova «Los
corpus diacrónicos al servicio del estudio de los arcaísmos
gramaticales», rastrea cuantitativamente la pervivencia de un
arcaísmo gramatical concreto (construcciones intransitivas con el
auxiliar </span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">ser</span><span xml:lang="es-ES"
lang="es-ES">) según su uso en determinadas tradiciones discursivas.
El período de estudio se centra entre los siglo XVII y XX, período
en el que se considera que dicha construcción resulta ya arcaizante.
La perspectiva teórica del trabajo se basa en el paradigma de las
tradiciones discursivas y por ello se analizan las ocurrencias de la
construcciones con </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">ser</span><span xml:lang="es-ES" lang="es-ES">
controlando su aparición en dos corpus (</span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Corpus de
español</span><span xml:lang="es-ES" lang="es-ES"> y CORDE) según
las siguientes tradiciones discursivas:  religiosa, jurídica,
descriptiva, historiográfica y política.  La conclusión de la
autora es que el uso de corpus diacrónicos amplios en el estudio de
la evolución de la lengua o en la permanencia de estructuras
fosilizadas en algunas tradiciones discursivas tiene la ventaja de
remediar el desajuste entre el análisis necesariamente idealizado de
las descripciones en las gramáticas clásicas frente al uso de datos
objetivos y computables.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">En el último trabajo recogido en el
volumen «Notas aclaratorias sobre la historia del indefinido
</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">alguien</span><span xml:lang="es-ES"
lang="es-ES">: una aplicación directa del uso de corpus
diacrónicos», Enrique Pato hace uso del CODEA, del </span><span
class="cursiva"  style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">Corpus del español</span><span xml:lang="es-ES"
lang="es-ES"> y del corpus </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES" lang="es-ES">Biblia
medieval</span><span xml:lang="es-ES" lang="es-ES"> para el rastrear
la evolución del pronombre indefinido </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">alguien</span><span xml:lang="es-ES" lang="es-ES">. El
uso de los tres corpus permite al autor retrasar las primeras
ocurrencias del indefinido al siglo XIII, confirmar documentalmente su
origen en las variedades occidentales (leonés y gallego-portugués) y
su incorporación a través de ellas al castellano. Igualmente el
autor analiza la frecuencia de las formas tónicas y átonas
(</span><span class="cursiva"  style="font-style:italic;"
xml:lang="es-ES" lang="es-ES">alguién/alguien</span><span
xml:lang="es-ES" lang="es-ES">) a lo largo de la historia del español
y su competencia con el indefinido </span><span class="cursiva" 
style="font-style:italic;" xml:lang="es-ES"
lang="es-ES">alguno</span><span xml:lang="es-ES" lang="es-ES"> que
perdura todavía en algunas variedades americanas del
español.</span></p>
    <p dir="ltr" style="text-align:justify;margin-bottom:10pt"><span
xml:lang="es-ES" lang="es-ES">La conclusión que podemos extraer de la
lectura de las contribuciones es que se ha iniciado un camino: el del
diseño y la creación de corpus específicos para el estudio
diacrónico de las variedades iberorromances, y que nos encontramos
todavía en la fase de constitución de los mismos. El volumen es un
llamamiento a la creación de una verdadera disciplina de
lingüística de corpus en el contexto de los estudios diacrónicos
del español y de otras variedades romances peninsulares. Esta llamada
se explicita en el hecho de que la mayor parte de los trabajos no
abordan todavía las herramientas, métodos y procesos informáticos o
estadísticos que acompañan a los diferentes corpus descritos y se
centran más en la descripción de los criterios de representación y
diseño, fases que lógicamente son anteriores y necesarias y que
resultan particularmente complejas de desarrollar en los corpus
diacrónicos que incluyen textos antiguos y de distintas tradiciones
escrituarias. Por lo tanto, el volumen ofrece una excelente
panorámica sobre las fases de diseño y desarrollo de los corpus
históricos iberorromances, y nos muestra que se avanza con propuestas
concretas en el camino de poder utilizar, mediante el análisis
computacional, las colecciones que se nos presentan. Pasos
fundamentales en dicho camino y que en este volumen se discuten muy
brevemente (ya que no se han realizado aún o se encuentran en fase de
desarrollo) son los problemas en la etiquetación gramatical o la
lematización de los textos antiguos y la necesidad de la
distribución de los corpus presentados, ya que las interfaces de
consulta de los textos, por muy complejas que puedan ser, no pueden
ofrecer un acceso total al uso de los textos y de sus marcaciones,
paso imprescindible para que los investigadores puedan realizar sus
propios acercamientos a los conjuntos documentales, realizar sus
propias pruebas estadísticas, adaptar las marcaciones a sus
requerimientos teóricos o comparar computacionalmente los testimonios
que se nos presentan en este volumen.</span></p>
    <p></p>
    <p>    </p>
   </div>
   <div id="footer" style="position: relative;width: 100%;height:
auto;top: auto;bottom: 0;right: 0;left:
0;margin-top:50px;margin-bottom:30px;">
    <p class="pie_de_pgina" awml:style="Pie de página" dir="ltr"
style="text-align:justify">    </p>
   </div>
  </div>
</div>
<div style="margin-left:20px;margin-right:20px;"><b>Versión en
PDF:</b><br /><a href="http://www.infoling.org/reviews/pdfs/NB142.pdf"
target="_blank"> http://www.infoling.org/reviews/pdfs/NB142.pdf</a><br
/><br /><b>Información en la web de Infoling:</b><br /> <a
href="http://www.infoling.org/informacion/Review51.html"
target="_blank">
http://www.infoling.org/informacion/Review51.html</a></div></body></html>