Biblia

INVESTIGACIÓN ESTADÍSTICA DE LA BIBLIA. La primera propuesta de un método…

INVESTIGACIÓN ESTADÍSTICA DE LA BIBLIA. La primera propuesta de un método…

INVESTIGACIÓN ESTADÍSTICA DE LA BIBLIA. La primera propuesta de un método estadístico para la investigación bíblica se hizo en 1851 cuando Augustus de Morgan sugirió el uso de la longitud media de las palabras para la comparación de Hebreos con las epístolas que comienzan con -Paul. . . " (Lord 1958: 282). Poco menos de un siglo después, comenzaron los estudios estadísticos reales sobre la autoría bíblica, estimulados por el trabajo de Udny Yule sobre la autoría de De Imitatione Christi.(Año Nuevo 1939). Los tres principales focos de interés han sido el Pentateuco, Isaías y las Epístolas Paulinas. Con base en el análisis estadístico, se ha afirmado que los primeros veintitrés capítulos del Génesis se ajustan a la Hipótesis Documental (Chenique 1967; Houk 1983), y de la misma manera se ha afirmado que ellos (y de hecho todo el libro) no ( Radday y Shore 1985). Se ha afirmado que Isaías no es de una mano (Radday 1973), y que lo es (Adams y Rencher 1973). Se ha afirmado que Filipenses, Colosenses y 1 o 2 Tesalonicenses son de una mano (Wake 1948) y que son de tres manos (Morton 1978). Para citar a Tallentire (1971: 117):

Las conclusiones a las que se llega sobre el estilo, a través de metodologías computacionales, lejos de ser -definitivas- en virtud de su objetividad, son mutuamente contradictorias.

Algunas conclusiones poco fiables se han derivado de datos erróneos, muchas de ellas por un método estadístico erróneo, pero la mayoría por una interpretación errónea. A menudo, ambos resultados contradictorios son incorrectos en el sentido de que ninguno es una inferencia válida derivada de los datos. El hecho de que, hasta ahora, los resultados finales de la mayoría de las investigaciones en esta área hayan sido seriamente defectuosos, no indica que los métodos estadísticos tengan poco que contribuir a los estudios bíblicos, sino más bien que se debe tener mucho más cuidado en su aplicación e interpretación.

A. Preliminares     

1. El estado de las cosas     

2. Argumentos en contra del uso de estadísticas     

3. Evaluación de la literatura     

4. El análisis del estilo     

B. Estudios de autoría temprana     

1. de Morgan sobre Hebreos (1851)     

2. Mendenhall sobre Shakespeare (1901)     

3. Yule on De Imitatione Christi (1939)     

C. Estudios en el NT     

1. Despierta a la autoría de las epístolas paulinas (1948)     

2. Grayston y Herdan sobre la autoría de las pastorales (1959)     

3. Morton sobre la autoría de las epístolas paulinas (1963)     

4. Kenny sobre estilometría (1986)     

5. Neumann sobre la autenticidad de las epístolas paulinas (1990)     

D. Estudios de la Biblia hebrea     

1. El problema de Isaías     

2. Composición oral y escrita: Bee (1971)     

3. La hipótesis documental     

4. Otras investigaciones de estilo / uso     

5. Ortografía en la Biblia hebrea: Anderson y Forbes (1986)     

E. Observaciones finales     

A. Preliminares     

1. El estado de cosas. El estado de los métodos estadísticos en la investigación bíblica está bien descrito por M. Halle (1958: 28), sustituyendo lingüista por erudito bíblico :     

Algunos de nosotros consideramos cualquier cosa con atuendo matemático como si fuera una revelación de lo alto, mientras que otros la rechazan de plano como un esfuerzo por intimidar al [erudito bíblico] para que acepte conclusiones que no está en posición de verificar. Los toscos intentos de aplicar técnicas matemáticas inadecuadas a problemas irrelevantes, por lo tanto, no solo hacen perder el tiempo a quienes llevan a cabo la investigación, sino que también aumentan la resistencia entre [los eruditos bíblicos] a los desarrollos que representan un progreso genuino.

La responsabilidad de este estado de cosas recae en los usuarios a menudo reverenciales de la estadística, cuyas exposiciones entusiastas sustituyen con frecuencia la afirmación por una explicación cuidadosamente elaborada, y en sus críticos, que con frecuencia registran sutilezas técnicas en lugar de abordar las cuestiones fundamentales. Si se agregan algunas descargas ocasionales de argumentos ad hominem, no es de extrañar que el desconcertado no combatiente abandone el campo.

2. Argumentos en contra del uso de estadísticas. Están aquellos para quienes la empresa se siente inapropiada, aquellos que "miran con recelo cualquier método de estudio literario que intente encontrar la verdad de la composición literaria consciente en las estadísticas numéricas de las que ha volado el espíritu de la computadora" (Knox 1963: 116) . A estos sólo se les puede ofrecer garantías de que pueden comprender y criticar métodos explicados correctamente, y que los métodos estadísticos son sólo una de las muchas formas de comprender nuestros textos.     

Hay quienes sostienen que el lenguaje se rige por reglas, por lo que los métodos estadísticos no son aplicables. Tales argumentos fueron comunes durante el auge de la gramática generativa cuando el nuevo método estaba despejando el camino para su ascendencia (Chomsky 1957: 18). Si bien se ha demostrado que "el lenguaje no puede ser exactamente un proceso de Markov", un proceso en el que la probabilidad de encontrar un elemento en particular está determinada únicamente por los elementos que lo han precedido (Good 1969: 374), se puede llegar muy lejos de hecho, modelar el lenguaje como un proceso de Markov. Quizás una analogía resulte útil: si bien es cierto que la física newtoniana debe ser suplantada por la física einsteiniana para poder explicar completamente los fenómenos observados, en la mayoría de las situaciones la física newtoniana proporciona una representación aproximada totalmente adecuada.

Finalmente, hay quienes sostienen que los métodos habituales de estadística inferencial son inapropiados para estudiar el lenguaje porque no se cumplen los requisitos para su aplicabilidad. En su lugar, deben utilizarse métodos descriptivos (Weil 1974: 29). (La estadística inferencial hace inferencias sobre las características de poblaciones completas [reales o hipotéticas] basadas en muestras extraídas de ellas. Se contrasta con la estadística descriptiva,que comprime la descripción de datos y / o transforma los datos de manera que permitan al analista hipotetizar relaciones previamente ocultas). Esta actitud es ciertamente comprensible, dado el excesivo celo inferencial que se manifiesta en gran parte de la literatura. Pero también es un ejemplo del "error demasiado común de la reacción exagerada" (Mallows y Tukey 1982: 114). Se necesitan tanto análisis descriptivos exploratorios como procedimientos inferenciales cuidadosamente formulados.

3. Evaluación de la literatura. En repetidas ocasiones en este ensayo, la literatura que aplica métodos estadísticos en la investigación bíblica se evaluará respondiendo las siguientes cinco preguntas:     

1. ¿Son sólidos los datos? Por lo general, uno debe aceptar con fe que los datos primarios son precisos. Ocasionalmente, las verificaciones internas y / o las comparaciones de recuentos brutos con los obtenidos de otros conjuntos de datos permiten evaluar parcialmente la integridad de los datos.     

2. ¿Son suficientes los datos para la tarea? Este es un tema fundamental en los estudios estadísticos: el problema del tamaño de la muestra. Si el conjunto de datos es demasiado pequeño, la confianza que se puede tener en las inferencias basadas en él o en las hipótesis sugeridas por él será demasiado limitada.     

3. ¿Se ha probado el método en el contexto de uso actual? Las suposiciones que subyacen al método deben ser explícitas, y se debe proporcionar evidencia de que los datos se ajustan lo suficiente a las suposiciones para que el uso del método sea defendible.     

4. ¿Se ha utilizado el método con las garantías adecuadas? La investigación adecuada incluye las salvaguardias tomadas para garantizar que las manipulaciones (informáticas) utilizadas para extraer los resultados se lleven a cabo de manera confiable.     

5. ¿Están justificadas las conclusiones? Dados los resultados obtenidos a través de métodos apropiados y validados aplicados a un muestreo suficiente de datos precisos, el investigador no debe saltar a conclusiones injustificadas en cuanto a los mecanismos causales y en cuanto a la confianza que se puede depositar en los resultados.     

4. El análisis del estilo. Antes de examinar la literatura, presentaremos las principales ideas de un artículo de sensibilización de Doležel (1969). Sus preceptos proporcionan un antídoto contra las muchas afirmaciones e inferencias erróneas que encontraremos.     

Un escritor X i de la lengua L en algún contexto práctico Q j produce un conjunto de textos T (X i , Q j ). Aquí X 1 podría ser Isaías, X 2 podría ser Jeremías, X 3 podría ser Ezequiel, etc. ; Q 1 , Q 2 , etc., pueden referirse a diversas situaciones de la vida que encontraron los profetas. La gama de posibilidades en todos los hablantes en todos los contextos posibles para la lengua L se resume en la Tabla 1, adaptada del artículo de Doležel .

Cuando sumamos textos en la fila superior (en todos los contextos concebibles), obtenemos T (X 1 ), el conjunto de todos los textos producibles por Writer X 1 . Cuando sumamos los textos en la primera columna (sobre todos los posibles escritores), obtenemos T (Q 1 ), el conjunto de todos los textos producibles en el contexto Q 1 . Cuando sumamos todas las combinaciones de escritor y contexto, obtenemos T (L), el conjunto de todos los textos en el idioma L.

Doležel distingue tres tipos de escritores: si la composición es independiente del contexto, tenemos un escritor libre de contexto , un poeta. Si la composición está determinada por el contexto, si la individualidad no tiene ningún efecto sobre la composición, tenemos un escritor ligado al contexto , un burócrata. Si tanto la individualidad como el contexto afectan la producción, tenemos un escritor sensible al contexto , un "escritor común". Dejando de lado la sociopatología, los factores subjetivos y objetivos afectan de manera diferencial la escritura de todos en un momento u otro. Es decir, todos somos escritores a veces libres de contexto, a veces ligados al contexto y, a veces, sensibles al contexto.

El conjunto de todos los textos en una lengua, T (L), se puede clasificar en términos de los factores subjetivos (X i y los factores objetivos (Q j ) que condicionan sus características. Algunas características serán homogéneas en todos los textos. Estos Doležel se refiere como supra-estilístico. Su ejemplo de tal característica es la distribución de grafemas en los textos. Otras características, llamadas sub-estilísticas, varían de manera impredecible en los textos de un idioma. (Doležel especula que las variaciones son el resultado de factores pragmáticos no tenidos en cuenta por su teoría.) Sub-estilística Las características son la perdición de cualquier teoría estadística del estilo, ya que son variables de confusión, variables que pueden llevar a los incautos a inferir efectos donde no existen.

Cuando se quitan de consideración las características supra-estilísticas y sub-estilísticas, se queda con un conjunto de características (Doležel las simboliza por C k ) cuya dependencia de factores subjetivos (X i ) y factores objetivos (Q j ) debería ser posible mapear. Algunos de los C kdependerá solo de factores subjetivos, otros dependerán solo de factores objetivos, mientras que otros dependerán de ambos. Desafortunadamente, "son posibles las alternancias de factores que controlan la misma característica". Por ejemplo, la longitud de la oración en algunos textos puede estar controlada solo por factores subjetivos (especifique el autor). En otros, puede ser controlado solo por factores objetivos (estar determinado por el contexto). Y en otros, puede ser controlado por ambos. En el segundo caso, la longitud de las oraciones será completamente engañosa para estudiar la autoría; en el tercer caso, solo será útil si se controlan cuidadosamente el contexto.

Tabla 1.

Textos y sus factores condicionantes

Contextos

Escritores

Q 1

Q 2

∙ ∙ ∙

Q m

X 1

T (X 1 , Q 1 )

T (X 1 , Q 2 )

∙ ∙ ∙

T (X 1 , Q m )

T (X 1 )

X 2

T (X 2 , Q 1 )

T (X 2 , Q 2 )

∙ ∙ ∙

T (X 2 , Q m )

T (X 2 )

∙ ∙ ∙

∙ ∙ ∙

∙ ∙ ∙

X n

T (X n , Q 1 )

T (X n , Q 2 )

∙ ∙ ∙

T (X n , Q m )

T (X n )

T (Q 1 )

T (Q 2 )

∙ ∙ ∙

T (Q m )

T (L)

B. Estudios de autoría temprana     

1. De Morgan sobre Hebreos (1851). En 1851, el eminente lógico y matemático A. de Morgan escribió a su amigo clérigo W. Heald proponiendo el uso de la longitud media de las palabras para la comparación de Hebreos con cada una de las Epístolas cuya palabra inicial es -Paul-. . . " Afirmó (Lord 1958: 282):     

Esperaría encontrar que un hombre que escribe sobre dos temas diferentes está más de acuerdo consigo mismo [en lo que respecta a la longitud media de las palabras] que dos hombres diferentes que escriben sobre el mismo tema. Algunos de estos días, esta prueba detectará escrituras falsas. Eso sí, te lo dije.

No tenemos constancia de que De Morgan o Heald hayan llevado a cabo tal investigación.

2. Mendenhall sobre Shakespeare (1901). Siguiendo el ejemplo de De Morgan, pero utilizando la distribución de la longitud de las palabras en lugar de la longitud media de las palabras, el físico estadounidense TC Mendenhall estudió las obras de Shakespeare junto con las de otros isabelinos. Encontró que las distribuciones de longitud de palabras para Shakespeare y Bacon eran considerablemente diferentes, mientras que las de Shakespeare y Marlow eran muy similares, produciendo -algo parecido a una sensación. . . entre los que se dedican al trabajo -(Mendenhall 1901).     

3. Yule on De Imitatione Christi (1939). GU Yule introdujo estadísticas de longitud de oraciones como índices específicos del autor. Estos se utilizaron para seleccionar a Thomas à Kempis en lugar de a Jean de Gerson como autor de De Imitatione Christi. Tenga en cuenta que Yule mostró escritos de cada autor candidato y preguntó si el comportamiento encontrado en De Imitatione Christi estaba más cerca de uno u otro, una situación particularmente sencilla. En El estudio estadístico del vocabulario literario (Yule 1944), Yule presentó su -característica K-, una medida de diversidad de vocabulario. Este trabajo fue el evento desencadenante para el uso de métodos estadísticos en la investigación bíblica.     

C. Estudios en el NT     

Primero tomamos los estudios estadísticos del NT, ya que estos se pusieron en marcha casi veinte años antes del trabajo estadístico sobre la Biblia hebrea. Daremos mucha atención al trabajo más antiguo porque sus limitaciones reaparecen repetidamente en la literatura.

1. Despierta sobre la autoría de las epístolas paulinas (1948). Dejando de lado la investigación que involucra conteos simples, W. Wake fue el primero en aplicar métodos estadísticos a un problema bíblico. Su artículo sienta un precedente lamentable: debido a que los textos son breves y el rango de extensión de las oraciones limitado, el problema de la discriminación -sólo puede resolverse mediante ciertas técnicas estadísticas modernas, cuyos resultados se dan aquí, pero no el trabajo ni el detalle. argumento que establece la validez del uso -(1948: 51). Estas omisiones convierten la evaluación del trabajo de Wake en un ejercicio frustrante.     

Usando el Textus Receptusde 1863 de las que se han eliminado las listas y tratando los dos puntos griegos como un punto, Wake tabula las distribuciones de la longitud de las oraciones para el corpus paulino. Es decir, cuenta cuántas oraciones tienen entre una y cinco palabras, entre seis y diez palabras, y así sucesivamente para cada epístola. (Los intervalos de cinco palabras se eligen de modo que cada uno contenga recuentos suficientes para que el análisis estadístico sea confiable). Excluye a Filemón y Tito con el argumento de que son demasiado cortos para el análisis. Por razones críticas, 2 Corintios se divide en 2 Corintios 1-9 y 2 Corintios 10-13. Al dividir las diversas epístolas en secciones, Wake caracteriza las distribuciones de longitud de oraciones (al examinar cómo los puntos críticos de una distribución, como la mediana, varían entre las secciones) y agrupa los doce textos en dos grupos principales más cuatro rezagados: (1) 1 Corintios, 2 Corintios 10-13, Gálatas, Romanos; (2) 1-2 Tesalonicenses, Filipenses, Colosenses; (3) Efesios; (4) hebreos; (5) 1-2 Timoteo; (6) 2 Corintios 1-9. Concluye que los dos grupos principales tenían cada uno su propio autor.

¿Son sólidos los datos? Wake proporciona muy poca información para permitir una evaluación significativa. Afirma que para Efesios la longitud media de las oraciones es de 18,2 palabras y el noveno decil (longitud por debajo del cual se encuentran el 90 por ciento de las oraciones) es de 36,7 palabras. Morton (1978: 173) informa valores de 30,31 y 58,75, respectivamente. Estas diferencias pueden deberse al uso de diferentes ediciones del NT y / oa diferentes formas de especificar palabras y oraciones. (De hecho, Morton [1978: 167] critica levemente a Wake por usar una edición obsoleta del Nuevo Testamento. En un artículo posterior, Wake analiza la definición de longitud de oración [1957: 334].)

¿Son suficientes los datos para la tarea? Wake solo da la tranquilidad de que las secciones son "cada una lo suficientemente larga". Su artículo posterior (1957) brinda más detalles sobre la sección del texto, pero no hace referencia a los métodos que se utilizaron en su trabajo anterior.

¿Se ha probado el método en el contexto de uso actual? Dado que Wake da pocos detalles, solo podemos suponer. De sus pocas pistas, inferimos que sus métodos suponen que las distribuciones son gaussianas, es decir, tienen la forma de la curva de graduación normal en forma de campana estándar. De hecho, ellos no lo son. Los datos parecen ser tales que sus logaritmos siguen la distribución gaussiana en forma de campana (Morton 1978: 176). En su obra posterior (1957: 331), Wake transforma apropiadamente datos de longitud de oraciones no bíblicos para que sean más casi gaussianos.

¿Se ha utilizado el método con las garantías adecuadas? Además de comparar las dispersiones de distribuciones para permitir la agrupación de textos, Wake también lleva a cabo un -análisis de varianza- (ANOVA), que arroja resultados similares. No explicaremos ANOVA. Si bien es robusto a las desviaciones de los datos de la distribución gaussiana asumida, implica otros supuestos con respecto a los cuales deben evaluarse los datos (Sachs 1984: 494).

¿Están justificadas las conclusiones? Según Wake (1948: 54): "La explicación más obvia para la existencia de dos grupos separados y distintos es que son obra de diferentes autores". Que una explicación sea "obvia" no la hace verdadera. Yule, en su estudio de De Imitatione Christi,usó distribuciones de longitud de oraciones para comparar su texto cuestionado con textos que se sabe que son de los dos autores candidatos que consideró. El problema de Wake es más difícil. Tiene varios textos y desea decidir cuántos autores deben haber tenido. La situación de Yule implicó el aprendizaje supervisado, mientras que la situación de Wake es el caso mucho más difícil de aprendizaje no supervisado. Para que Wake tenga éxito, debe demostrar que, para los criterios que eligió, las diferencias entre ciertos textos son mayores que las diferencias dentro de los textos. Si tiene éxito de manera convincente, debe demostrar que las diferencias entre textos se explican por factores puramente subjetivos, que los factores objetivos, como la audiencia, el género o la edad del autor, no tienen ningún efecto.

Wake puede haber demostrado que algunas diferencias entre textos en la distribución de la longitud de las oraciones superan significativamente las diferencias dentro del texto, lo que hace que la identificación de grupos de textos sea razonable. Desafortunadamente, no ha proporcionado información suficiente para permitirnos juzgar. Pero no muestra que las diferencias que detecta se deban únicamente a diferencias de autor. Considere tres hallazgos no disponibles para Wake; (1) CB Williams (1970: 60-63) mostró que la longitud de las oraciones para la prosa "descriptiva" y el "diálogo" de Lord Dunsany difería enormemente. (2) También demostró que la rima afectaba en gran medida la longitud de las oraciones de Masefield. (3) KR Buch (1969) mostró que la distribución de la longitud de las oraciones de un autor para obras escritas con veinte años de diferencia era muy diferente. Ninguno de estos resultados involucró al griego koiné, por lo que no refutar que la longitud de la oración especifica el autor para el corpus paulino. Pero sí ilustran que no es "obvio" que las diferencias en la distribución de la longitud de las oraciones indiquen cambios en el autor. En su artículo posterior (1957: 345), Wake concluye:

Las distribuciones marcadamente sesgadas de la longitud de las oraciones de los pasajes de prosa continua parecen mostrar una constancia que les permite ser utilizados como criterios objetivos del estilo de autoría. Las distribuciones solo varían de una muestra a otra de la manera esperada para muestras extraídas al azar de una población fija de longitudes de oraciones. Esto parece ser cierto para todos los autores griegos e ingleses y la excepción que proporcionan las obras de Platón puede explicarse por la forma literaria adoptada. En cualquier caso son característicos aunque su variabilidad es mayor que la que se obtendría mediante un muestreo aleatorio de una sola población, ya que parece haber una tendencia con la edad superpuesta.

En forma condensada: las distribuciones de longitud de oraciones son específicas del autor, excepto cuando no lo son. Cuando no lo son, se pueden encontrar razones (forma literaria, tendencia de edad).

2. Grayston y Herdan sobre la autoría de las pastorales (1959). Grayston y Herdan con simpatía exponen y critican el análisis de Harrison de la -conectividad de vocabulario- de las Pastorales (Harrison 1921) en preparación para llevar a cabo un análisis más riguroso. Introducen -la probabilidad alternativa de que una palabra sea peculiar a la parte o común a todas las partes- del corpus en estudio. Si V peculiar i es el número de tipos de palabras (elementos de vocabulario) peculiares de la parte i de un corpus, V común es el número de tipos de palabras comunes a todas las partes del corpus, y V i es el número de tipos de palabras en la parte i, entonces esta probabilidad es: Para el Corpus Paulino, los valores de C i     varían de .30 a .35 para los no Pastorales, mientras que C Pastorales = .46, debido a la gran cantidad de elementos de vocabulario únicos. Concluyen (10): -La magnitud de C para las Pastorales [es decir, de C Pastorales ] apoya fuertemente la hipótesis de autoría no paulina-.

También grafican el logaritmo del tamaño del vocabulario (logV) frente al logaritmo de la longitud del texto (logN) para cada epístola. Las epístolas paulinas, excluidas las pastorales, se encuentran cerca de una línea recta, mientras que cada epístola pastoral se encuentra a una distancia considerable por encima de la línea. -Esto confirma de manera formal la sospecha sobre la autoría paulina de estas epístolas- (14). Weitzman (1971) demuestra que el comportamiento observado probablemente sea simplemente el resultado de variaciones en la longitud del texto.

Con encomiable reserva, Grayston y Herdan finalmente afirman (15):

En conjunto, se puede decir que la evidencia lingüística es lo suficientemente fuerte como para justificar la conclusión de un estilo muy diferente en las Pastorales. Si esto implica una diferencia en la autoría depende de la concepción que uno tenga de lo que significa el estilo. Las estadísticas no pueden hacer más que establecer tales diferencias.

(Los lectores que deseen detalles adicionales sobre estos métodos deben consultar el trabajo posterior de Herdan [1960: 245-52; 1966: 219-49], donde se estudian tanto las Epístolas Paulinas como el NT completo. Note también el breve tratamiento de Weitzman de las epístolas del NT en su buscar características de texto que sean independientes de la longitud del texto [1986b: 872].)

En cuanto a la solidez de los datos, el estudio obtiene sus recuentos del volumen confiable de Morgenthaler (1958) y, por lo tanto, se puede confiar en él.

En cuanto a la exactitud de la preparación de la muestra, las muestras de los textos no están involucradas en ninguna parte, utilizándose recuentos exhaustivos. Sin embargo, si cada epístola se viera como una muestra extraída de una población invisible de escritos por su autor, sería posible agregar intervalos de confianza a los diversos resultados. Es decir, Grayston y Herdan podrían haber indicado qué confianza podría tener el lector en los diversos resultados como reflejo de lo que se encontraría si tuviéramos acceso a textos más extensos.

En cuanto a la exactitud de sus métodos en este contexto, se proporciona poca información de antecedentes. Visto como dos enfoques descriptivos, es difícil criticar su método. Cuando se hacen inferencias sobre lo que constituyen diferencias significativas, el trabajo deja de involucrar estadísticas y cae en el impresionismo.

En cuanto a la idoneidad de las salvaguardias, el documento incluye detalles completos de la aritmética, lo que permite al lector verificar el trabajo.

¿Están justificadas las conclusiones? La prisa por sacar conclusiones precipitadas sobre la autoría múltiple en el cuerpo del artículo se ve compensada por la imparcialidad de las palabras finales. La mayoría estaría de acuerdo en que han demostrado que las pastorales difieren de las epístolas paulinas en cuanto a diversidad de vocabulario. No se ha demostrado que este comportamiento se deba a diferentes autores y no a la forma literaria, el tema, etc.

3. Morton sobre la autoría de las epístolas paulinas (1963). Comenzando con su pendenciero artículo en The London Observer del 3 de noviembre de 1963 (-Una computadora desafía a la Iglesia-) y culminando en el cap. 14 de su libro Literary Detection (1978: 165-83), AQ Morton y sus colaboradores han escrito repetidamente sobre el problema de la autoría del corpus paulino. La siguiente exposición se basa en el libro de 1978, con referencias a trabajos anteriores según sea necesario. Incluimos la mayoría de nuestros comentarios a medida que avanzamos. (La crítica de la presentación de Morton ante la Royal Statistical Society sigue siendo relevante [Morton 1965: 224-33].)     

Según Morton (38): -El principio fundamental de la estilometría se puede establecer así: la autoría de los textos se determina observando hábitos que son comunes a todos los escritores de la clase examinada. Cada escritor utiliza los hábitos a su propio ritmo. Los diferentes escritores se separan calculando las diferencias entre sus tarifas ".

Morton señala que las distribuciones observadas se pueden caracterizar en términos de la media, mediana, percentiles, etc. habituales, o se puede intentar ajustarlas a distribuciones teóricas. Se aconseja al lector interesado en distribuciones teóricas que las conozca en otro lugar que no sea en el cap. 5 de Detección Literaria. Allí se encuentran confusas desventuras pedagógicas: símbolos que representan recuentos en una página y probabilidades en la siguiente (pyq en 54 y 55), expresiones llamadas ecuaciones (55), probabilidad negativa (60), la afirmación (68) de que "La distribución chi cuadrado es:" con la afirmación y la definición incorrectas. La definición debería decir: (Aquí, O i son recuentos observados y E ison recuentos estimados usando algún modelo. Usaremos esta definición a continuación.) La afirmación debería ser que "X 2 obedece a la distribución chi cuadrado (χ 2 )". También se encuentra una profusión de errores tipográficos y anotaciones descuidadas, todas contadas más de veinte en el capítulo. Todos estos errores debilitan un capítulo importante en el claro libro de Morton.

Morton da las características de cualquier hábito de escritura utilizado para la identificación del autor (96):

Primero, debe ser un hábito evidente en una elección que frecuentemente confrontan todos los autores; segundo, debe ser un hábito que pueda expresarse numéricamente; y tercero, debe ser un hábito que pueda demostrarse que no se ve afectado por cambios en el tema, por el paso de los períodos de tiempo, por diferencias razonables en la forma literaria y todas las demás influencias posibles que puedan afectar el hábito.

Así (98), "cualquier hábito que esté ligado a sustantivos, por estar ligados a un tema, es poco probable que sea un buen indicador de autoría". Y (101): -Un idioma sin inflexiones, el inglés, por ejemplo, hace que las distribuciones de la longitud de las oraciones sean mucho menos útiles. . . la longitud media es mayor, pero la varianza aún más ". La primera observación hace que Morton desconfíe de los criterios de riqueza de vocabulario. Este último, su distinción entre lenguajes flexionados y no flexionados, a menudo es ignorada por los críticos de sus métodos.

En su trabajo clásico, Mosteller y Wallace se basaron en gran medida en la frecuencia de las palabras funcionales (1984: 39). Herdan (1966: 172-74) atacó el uso acrítico de palabras funcionales para determinar la autoría y Damerau (1975) lo cuestionó seriamente. Morton ve dificultades para confiar en palabras funcionales comunes. Escribe (102, 104):

. . . parecería que . . . las palabras comunes serían buenos indicadores de autoría si se pudiera demostrar que un autor las usa a un ritmo constante y los autores individuales difieren en sus tasas de uso. La dificultad de utilizarlos como prueba de autoría es que la forma literaria de la obra que se estudia influye con demasiada facilidad en su aparición. . . Para problemas [con] una gran cantidad de muestras y una selección limitada de autores, la tasa de aparición de palabras frecuentes ofrece un amplio material para la decisión. Pero si faltan estos dos factores, hay mucho menos margen.

Morton, por tanto, se aparta de los criterios centrales de sus primeros trabajos (1963; 1965). Ahora afirma que los mejores discriminadores de autor son las posiciones absolutas de las palabras en las oraciones (para idiomas con inflexiones) y las posiciones en términos de palabras cercanas (para idiomas sin inflexiones).

En griego, las distribuciones de la longitud de las oraciones "son un indicador eficaz de autoría" (108). Para el escritor griego Isócrates, Morton encuentra diferencias en la distribución de la longitud de las oraciones, que concluye que se deben a diferencias en la forma literaria más que al paso del tiempo. Luego señala que hay algunas pruebas (129):

. . . que no se ven afectados en absoluto por la variedad de la forma literaria, algunas que se ven afectadas por un cambio en la forma literaria y otras que se ven afectadas por el paso de los años. Siempre que se tenga cuidado al hacer comparaciones de textos que tienen formas literarias contrastantes, las pruebas de autoría son fiables.

Un autor apenas tipifica a todos los escritores de griego. Como Morton admite en otra parte (102), "la forma literaria no se puede definir claramente en detalle". (Tenga en cuenta que Brainerd [1979 y 1980] ha producido estudios convincentes de Shakespeare en los que un conjunto de características del texto separa sus obras en grupos de géneros mientras que otro las ordena cronológicamente).

El capítulo 14 de Detección literaria, -La autoría de las epístolas paulinas-, presenta argumentos basados ​​en distribuciones de longitud de oraciones más resultados limitados para estudios posicionales. Cuando resulta útil, extraemos materiales de apoyo de la exposición más completa de Morton y McLeman (1966). Morton considera que la evaluación del corpus paulino tiene dos fases: primero, establecer la autoría de las epístolas individuales y, segundo, determinar la integridad interna de las epístolas individuales. La primera fase se ejecuta a través del análisis de la longitud de la oración más otras pruebas independientes de la longitud de la oración, la segunda a través del análisis posicional. Tras discusiones detalladas sobre la determinación del tamaño de la muestra y las transformaciones de datos apropiadas, Morton (180) revela sus conclusiones basadas en distribuciones de longitud de oraciones:

Romanos, I y II Corintios y Gálatas forman un grupo y los otros están separados de él. En la escala lineal [es decir, para los datos no transformados] hay una anomalía en el tercer cuartil de II Corintios [la longitud de la oración por debajo de la cual se encuentran las tres cuartas partes de las oraciones] y esto puede deberse al azar. La tabla tiene cinco estadísticas para cinco epístolas y es probable que aparezca una diferencia del 5%, ya que podría resultar ser un indicador de la enmienda de este texto.

Este pasaje es engañoso en dos aspectos, uno fáctico y otro interpretativo.

Realidad: La tabla a la que se hace referencia contiene estadísticas de diez, no cinco, epístolas. Por lo tanto, si sus pruebas tienen la posibilidad de equivocarse en el cinco por ciento de los casos, puede obtener hasta dos diferencias "significativas" que son falsas.

Interpretativo: Dado que Morton ofrece una explicación escasa sobre cómo llega a sus conclusiones, debemos reconstruir sus procedimientos. Las ideas básicas se insinúan en sus primeros trabajos (Morton 1965: 217; Morton y McLeman 1966: 53).

Para cada epístola y parámetro (media, mediana, etc.), suma y resta el doble del error estándar (EE) de ese parámetro para formar su intervalo de confianza del 95%. Es decir, determina el rango de valores dentro del cual se encuentra el verdadero parámetro (con una probabilidad entre veinte, en promedio, de cometer errores) basándose en las estimaciones del parámetro calculadas a partir de los datos. Luego determina para qué epístolas qué estadísticas muestran diferencias significativas con el comportamiento de Gálatas, su patrón oro paulino. Anuncia en las notas de su mesa qué epístolas tienen intervalos de confianza que no se superponen con los de Gálatas. (Detrás de todo esto está su suposición de que sus parámetros son gaussianos). Encuentra que estas epístolas son significativamente diferentes de las de Gálatas; 2 Corintios (para un parámetro), Efesios (para 5), ​​Colosenses (para 2), 1 Tesalonicenses (para 4) y Hebreos (para 5). A continuación, examina cómo se comparan Gálatas y el resto en cuanto a las medias de las distribuciones basadas en los datos transformados logarítmicamente, y encuentra que Efesios, Filipenses, Colosenses, 1 Tesalonicenses y Hebreos difieren significativamente de Gálatas. De estos resultados surgen sus conclusiones citadas anteriormente.

Hay al menos tres problemas con su método y su interpretación de sus resultados: (1) Morton afirma que Romanos, 1-2 Corintios y Gálatas forman un grupo y los demás están separados de él. De hecho, su análisis muestra (para su satisfacción, ver más abajo) que 2 Corintios, Efesios, Filipenses, Colosenses, 1-2 Tesalonicenses y Hebreos no pertenecen a la misma población que Gálatas. En términos de estadísticas inferenciales, esto no implica que los demás sean de la misma población; simplemente muestra que las pruebas no le permiten a uno decidir si los demás son o no de poblaciones diferentes a los de Gálatas. Pueden ser. Si su afirmación se basa en alguna práctica oculta de estadística descriptiva, entonces debería explicar por qué, aunque 1 Timoteo y 2 Timoteo no fallan en ninguna prueba, no están incluidos entre los paulinos "genuinos". (2) 2 Corintios falla una prueba, pero es restaurada al redil paulino sobre la base de que se puede esperar un error en veinticinco pruebas. ¿Por qué restaurar 2 Corintios? Filipenses falla solo una prueba, entonces, ¿por qué no restaurarla? O, dado que hay cincuenta pruebas para las estadísticas que describen los datos sin procesar, ¿por qué no restaurar ambos? Si se va a excluir información a priori, debe excluirse sistemáticamente. (3) Las críticas a las distribuciones de longitud de oraciones como especificación de autor en C.1 anterior se aplican igualmente aquí. debe excluirse sistemáticamente. (3) Las críticas a las distribuciones de longitud de oraciones como especificación de autor en C.1 anterior se aplican igualmente aquí. debe excluirse sistemáticamente. (3) Las críticas a las distribuciones de longitud de oraciones como especificación de autor en C.1 anterior se aplican igualmente aquí.

Como prueba independiente (conservadora), llevamos a cabo un análisis de tabla de contingencia de las distribuciones de longitud de oraciones. En otro lugar hemos explicado este análisis (Andersen y Forbes 1986a: 15-25). Aquí damos solo una breve explicación. La Tabla 2 muestra los datos de longitud de las oraciones de Morton (1978: 172-73).

Tabla 2.

Longitudes de las oraciones en las epístolas

Longitudes de las oraciones (en palabras)

Epístola

1-5

6-10

11-15

16-20

21-25

26-30

31-35

> 35

Totales

Romanos

78

160

101

52

51

14

12

30

498

1 Cor

99

190

126

73

32

15

7

13

555

2 Cor

40

70

44

43

31

19

9

17

273

Galón

21

54

46

24

7

5

2

7

166

Eph

3

5

24

10

8

4

4

22

80

Phil

9

20

19

13

3

5

5

15

89

Columna

5

14

10

7

6

8

2

10

62

1 tes

4

15

7

11

7

4

6

12

66

2 tes

3

7

9

5

0

3

1

7

35

1 Tim

14

22

19

20

10

4

5

4

98

2 Tim

14

13

22

10

5

4

5

4

77

Titus

5

5

7

3

3

2

0

4

29

Phlm

0

7

3

2

0

1

1

3

17

Hebreos

13

47

73

39

29

22

12

27

262

Totales

308

629

510

312

192

110

71

175

2307

Seguimos a Morton al tomar a Gálatas como el punto fijo paulino. Probamos cada epístola para determinar si se originó en la misma población que Gálatas. Formamos una tabla de contingencia de 2 × 8 para cada emparejamiento de una epístola con Gálatas. Por ejemplo, para la prueba de si es probable que romanos y gálatas pertenezcan a la misma población, obtenemos la Tabla 3.

Tabla 3.

Distribuciones de cuaresma de oraciones observadas para romanos y gálatas

OBSERVADO

Longitudes de las oraciones (en palabras)

Epístola

1-5

6-10

11-15

16-20

21-25

26-30

31-35

> 35

Totales

Romanos

78

160

101

52

51

14

12

30

498

Gálatas

21

54

46

24

7

5

2

7

166

Totales

99

214

147

76

58

19

14

37

664

Si Romanos y Gálatas son muestras de la misma población, entonces esperamos que cualquier entrada de celda en la tabla sea estimada adecuadamente multiplicando el total de la fila por el total de la columna y dividiendo por el total general de la tabla. Esto equivale a asegurar tQué cada epístola recibirá su total observado de oraciones, al igual que cada rango de longitud de oraciones [1 a 5 palabras, 6 a 10 palabras, etc.]. (Para que estas estimaciones sean confiables, debemos asegurarnos de que cada estimación de recuento de células exceda la unidad en al menos un poco [Sachs 1984: 464]. Este es el caso de todas las epístolas excepto Tito y Filemón; en lugar de recurrir a procedimientos para tablas escasamente ocupadas, dejamos a un lado a Titus y Filemón.) Al realizar la aritmética para cada celda en la tabla de conteos de longitud de oración observados, se puede construir una segunda tabla, una tabla de conteos estimados basada en una población subyacente común asumida . La Tabla 4 muestra las estimaciones para Romanos y Gálatas, como el lector puede verificar.

Cuadro 4.

Distribuciones estimadas de la longitud de las oraciones para Romanos y Gálatas

ESTIMADO

Longitudes de las oraciones (en palabras)

Epístola

1-5

6-10

11-15

16-20

21-25

26-30

31-35

> 35

Totales

romano

74.25

160,5

110.25

57

43,5

14.25

10,5

27,75

498

Gálata

24,75

53,5

36,75

19

14,5

4,75

3,5

9.25

166

Totales

99

214

147

76

58

19

14

37

664

En general, las tablas OBSERVADO y ESTIMADO serán diferentes, ya sea porque la hipótesis de que se originan en una población común es errónea o debido a fluctuaciones de muestreo aleatorio. Para decidir si la explicación anterior explica las diferencias, se calcula la estadística X 2 definida anteriormente, se selecciona un umbral de significancia (seguimos a Morton al usar el 5%) y (teniendo en cuenta una sutileza conocida como "grados de libertad") se ve hasta un valor de umbral en las tablas de estadísticas (simbolizado por χ 2 .05 ). Si X 2 excede este umbral, rechazamos la hipótesis de que el par de epístolas es de la misma población; si X 2 está por debajo del umbral, no podemos rechazarla hipótesis de un origen compartido. Para nuestras comparaciones, las tablas estadísticas nos informan que χ 2 .05 = 18.5. Los valores de X 2 resultantes de nuestras pruebas por pares, ordenados de menor a mayor X 2 , se muestran en la Tabla 5.

Cuadro 5.

Resultados de la prueba de longitud de oraciones para las epístolas

Epístola

X 2

1 Corintios

5.91333

2 timoteo

12.33053

Romanos

12.39933

1 timoteo

12.51209

2 Tesalonicenses

16.52812

χ 2 .05

18,5

filipenses

19.20194

2 Corintios

20.49888

Colosenses

24.87708

1 Tesalonicenses

33.71813

Hebreos

35.3673

Efesios

51.73470

Con una probabilidad entre veinte de errar, podemos afirmar que una epístola que, en comparación con Gálatas, arroja un X 2 menor que 18,5 puede provenir de la misma población que Gálatas. Con una probabilidad entre veinte de equivocarse, podemos afirmar que una epístola que cuando se compara con Gálatas arroja un X 2 mayor que 18,5 no es de la misma población que Gálatas. Por lo tanto, nuestro análisis nos dice que, en lo que respecta a las distribuciones de longitud de oraciones, Filipenses, 2 Corintios, Colosenses, 1 Tesalonicenses, Hebreos y Efesios no provienen de la misma población que Gálatas. (Nota así que la magnitud de X 2 no no indican el grado de disimilitud de Gálatas. La longitud de una epístola influye en el tamaño de X 2.)

Morton nos dice que -las probabilidades que dejaron las distribuciones de la longitud de las oraciones como probabilidades para la autoría de Pauline [son] alrededor de cien a uno en contra- (182). Ojalá pudiéramos ver cómo se obtuvieron las probabilidades. Como recuperar las probabilidades de las pruebas de significancia y agravar los resultados de las comparaciones múltiples son áreas en las que se cometen errores estadísticos con mucha frecuencia, la mera afirmación nos deja insatisfechos.

Las probabilidades se mueven de cien a uno en contra de la autoría paulina a "más de un millón a uno en contra" (182) por la evidencia aportada por cuatro elementos de vocabulario en las posiciones de oración uno y dos: kai (en posición de oración uno), de (en posición de oración dos), gar (en la posición dos) y ei(en la posición uno). Estas cuatro pruebas posicionales son, si las afirmaciones de Morton se toman al pie de la letra, cien veces más poderosas que la longitud de la oración para determinar la autoría, sin embargo, dedica solo una página a su exposición (180). Una vez más, los métodos reciben una exposición mínima. Para este análisis, Morton considera dos conjuntos de epístolas: Romanos, 1-2 Corintios y Gálatas forman el Grupo I; el resto (menos Tito, 2 Timoteo y Filemón) forman el Grupo II. Tenga en cuenta que Morton está utilizando el resultado de su análisis anterior para agrupar las epístolas para este análisis. Las probabilidades resultantes, por lo tanto, no sonindependiente de las probabilidades anteriores. Pero hay un lapso más grave, común en los estudios de autoría. Morton parece realizar una secuencia de análisis de tablas de contingencia y luego componer sus valores p. Es decir, calcula la probabilidad de que toda la secuencia de resultados pueda suceder por casualidad. Hasta ahora todo bien, asumiendo que todo esto se hizo correctamente. Luego parece convertir el valor P compuesto en probabilidades. Este paso sólo puede darse en circunstancias muy especiales, cuya existencia debe demostrarse, no asumirse (Meier y Zabell 1980; MWA Smith 1983). Desde una perspectiva puramente estadística, no se han demostrado probabilidades de un millón a uno.

(Morton [1986] ha afirmado recientemente que el posicionamiento en oraciones de palabras que aparecen una vez es específico del escritor; MWA Smith [1987] ha planteado preguntas fundamentales sobre la afirmación de Morton. Además del trabajo en el corpus de Pauline, Morton y sus colaboradores han escrito varios libros sobre los Evangelios [MacGregor y Morton 1961; Morton y MacGregor 1965; Morton y McLeman 1980]. Remitimos a los lectores interesados ​​a estas y algunas reseñas asociadas [McCasland 1961; Cadbury 1965; Fortna 1983].)

En cuanto a la solidez de los datos de Morton, tenemos poco para continuar. Su conjunto de criterios ha evolucionado, por lo que incluso las comprobaciones a través de la coherencia interna rara vez son factibles. Por ejemplo, Morton usa recuentos decomo segunda o tercera palabra en oraciones en un estudio (Morton 1965: 222) y como segunda palabra sólo en otro (Morton 1978: 181), lo que hace imposible la comparación. Los datos sobre la longitud de las oraciones en su artículo de la Royal Society (1965: 218) difieren significativamente de los de su libro (1978: 172). Por ejemplo, en el primero, Romanos tiene 584 oraciones; en el segundo tiene 498. Y así sucesivamente, a través de todo el Corpus Paulino. Para trazar un perfil de la longitud de las oraciones de 1965 a 1978: Filemón pierde una oración de cada una de las categorías de 1 a 5, 6 a 10, 11 a 15 y 26 a 30 palabras, pierde tres oraciones de la categoría de 16 a 20 palabras y gana una oración en la categoría de 36 a 40 y otra en la categoría de 56 a 60 palabras. Se producen cambios mucho más drásticos en otras epístolas. Morton no proporciona ninguna explicación para estas diferencias.

En cuanto a la suficiencia de las muestras de datos para sus pruebas, su requisito de que "ninguna expectativa debe ser inferior a cinco" (1978: 69), es conservador según los estándares modernos (Sachs 1984: 475; Andersen y Forbes 1986a: 206). Da pruebas repetidas de la sensibilidad adecuada a la cuestión del tamaño de la muestra.

La propiedad de los métodos estadísticos utilizados y la validez de las conclusiones alcanzadas han sido comentadas en el transcurso de nuestra exposición. Otro punto que merece ser destacado: el importante efecto que puede tener la elección del nivel de significación. En sus primeros trabajos, Morton optó por utilizar un nivel de significancia del uno por ciento (1965: 217) para que cada prueba tuviera una probabilidad del 1 por ciento de producir un resultado erróneo. En su trabajo posterior sobre las Epístolas Paulinas, Morton eligió usar un nivel de significancia del 5 por ciento (1978: 180), obteniendo los resultados dados anteriormente. Si hubiera retenido el nivel del 1 por ciento, sus pruebas no habrían señalado ni a 2 Corintios ni a Filipenses como anómalos. Por lo tanto, según su lógica, Morton habría tenido que concederle a Filipenses la entrada en su lista de verdaderas epístolas paulinas.

4. Kenny en estilometría (1986). Anthony Kenny ha escrito un volumen bastante accesible y discreto. Sus primeros cuatro capítulos introducen cuidadosamente las ideas básicas de estilometría. Cap. Del 5 al 11 son descriptivos y abarcan palabras, conjunciones y partículas comunes, preposiciones, el artículo, los sustantivos y pronombres, los adjetivos y adverbios y el verbo. La atención se centra exclusivamente en las comparaciones intertextuales. No se hacen comparaciones intratexto, una desafortunada omisión. Cap. 12 a 14 consideren brevemente los problemas lucano, joánico y paulino. Cap. 15 critica varios de los métodos utilizados por Morton y sus colegas y los encuentra deficientes. El capítulo final trata sobre "Restricciones y perspectivas".     

Los datos de Kenny parecen sólidos y suficientes para las tareas intentadas. Los métodos modestos son apropiados para los objetivos limitados buscados. En general, las conclusiones extraídas están justificadas. Weitzman (1987) juzga acertadamente el volumen de Kenny como un "correctivo oportuno de las afirmaciones exageradas de algunos estudios estilométricos anteriores en el Nuevo Testamento". Para aquellos que buscan una introducción a la estilometría, el libro de Kenny es un excelente lugar para comenzar.

5. Neumann sobre las epístolas paulinas (1990). Kenneth Neumann ofrece una introducción a "El problema de la autenticidad" seguida de un examen claro de las variables descriptivas de texto utilizadas por sus predecesores en los análisis estadísticos de autoría. Aunque exhaustiva en su catalogación de las variables utilizadas, la encuesta carece del componente crítico sostenido necesario para ayudar a los posibles investigadores en su propia selección de variables. (En defensa de Neumann, debe notarse que es fundamental para su método de análisis un mecanismo que selecciona de su enorme lista de posibles discriminadores los supuestos mejores pocos).     

Tras una declaración detallada de su plan de investigación, Neumann informa sus resultados y comenta su importancia. Utilizando muestras de textos didácticos de siete autores (Paul, el escritor de Hebreos, Clemente, Ignacio, Epicteto, Josefo y Filón), su método diezma un total de 617 variables candidatas iniciales a seis. Si bien estas seis variables clasifican perfectamente los textos didácticos utilizados para seleccionarlos en primer lugar, asignan incorrectamente un tercio de una nueva ola de textos (de prueba). Neumann atribuye este comportamiento inaceptable a las diferencias de género entre los autores cristianos y no cristianos. Y así, el método se suministra con textos didácticos de sólo los cuatro autores cristianos y vuelve a aventar las variables. Después de un poco de manipulación desconcertante, todas las muestras de enseñanza y prueba se asignan correctamente. Cuando las controvertidas epístolas paulinas (Efesios, Colosenses y 2 Tesalonicenses) están clasificados, todos están asignados a Pablo pero no con mucha confianza. -Estos resultados, a pesar de la clasificación paulina, todavía pueden indicar una autoría no paulina- (Neumann 1990: 195). Hay indicios de que el método no es robusto. Por ejemplo: (1) el texto de Gálatas se asigna a Ignacio con una probabilidad de .99; este comportamiento incómodo se suprime eliminando, por motivos no estadísticos, dos secciones de la muestra del texto de Gálatas que se comporta mal (1990: 196); (2) Apocalipsis 2-3 se le asigna a Pablo; este resultado vergonzoso se explica de manera poco convincente (1990: 220). Hay indicios de que el método no es robusto. Por ejemplo: (1) el texto de Gálatas se asigna a Ignacio con una probabilidad de .99; este comportamiento incómodo se suprime eliminando, por motivos no estadísticos, dos secciones de la muestra del texto de Gálatas que se comporta mal (1990: 196); (2) Apocalipsis 2-3 se le asigna a Pablo; este resultado vergonzoso se explica de manera poco convincente (1990: 220). Hay indicios de que el método no es robusto. Por ejemplo: (1) el texto de Gálatas se asigna a Ignacio con una probabilidad de .99; este comportamiento incómodo se suprime eliminando, por motivos no estadísticos, dos secciones de la muestra del texto de Gálatas que se comporta mal (1990: 196); (2) Apocalipsis 2-3 se le asigna a Pablo; este resultado vergonzoso se explica de manera poco convincente (1990: 220).

El enfoque de Neumann es prometedor. Sin embargo, sus resultados varían mucho a medida que se seleccionan y deseleccionan variables y se modifican las muestras de texto. Esta sensibilidad sugiere que sus conclusiones actuales son demasiado frágiles para ser convincentes.

D. Estudios de la Biblia hebrea     

La investigación sobre la Biblia hebrea que utiliza técnicas estadísticas es demasiado extensa para cubrirla exhaustivamente aquí. Algunas de nuestras entradas bibliográficas no reciben discusión. Nos concentraremos en la exposición de estudios sobre estilo / autoría y ortografía.

1. El problema de Isaías. una. Radday (1970). Para nuestra crítica del trabajo de Radday sobre Isaías, nos centramos en su libro (1973) más que en su artículo anterior (1970). Después de rastrear la historia del problema de Isaías y contrarrestar algunas críticas de abordar el problema a través de la lingüística estadística, Radday describe la preparación del texto de Isaías para su análisis. Se utilizan las consonantes del texto Letteris de 1852, habiéndose resuelto cuidadosamente los homógrafos adjuntando a cada palabra un código gramatical que indique si se trata de: (1) un sustantivo, (2) un verbo finito, (3) otro tipo de verbo, (4) residuo. Los límites de las oraciones están marcados. Como señala Radday, llevar a cabo este programa requiere una sutileza considerable en cuanto a la definición de "palabra", "parte del discurso", "oración".          

Una vez preparados los datos, Radday examina las distribuciones de la longitud de las oraciones (1973: 65-92). Advierte (1973: 66):

Pero debe enfatizarse que antes de que la prueba de Yule [sobre distribuciones de longitud de oraciones] se tome como un medio infalible de atribuir un texto anónimo a un determinado autor, la longitud de la oración primero tendrá que ser examinada en las obras de un gran número de escritores. , cada uno en varios períodos de la vida del autor y en diferentes temas y géneros de su producción literaria. No antes de que la variación "dentro" de un escritor sea suficientemente conocida, la longitud de la oración se convertirá en un criterio lo suficientemente creíble para la comparación entre dos escritores.

Radday inmediatamente ignora su propio consejo, su razón es que muchos otros han "puesto su confianza en la prueba de Yule".

Para estudiar el comportamiento de partes de un texto de un solo autor, Radday construye dos muestras dividiendo un conjunto de 360 ​​oraciones esparcidas por Ezekiel (aproximadamente el 20 por ciento del libro por recuento de palabras o versículos). Calcula los descriptores de la distribución de la longitud de la oración para cada muestra (media, mediana, primer cuartil, tercer cuartil, noveno decil). Por globo ocular,decide que cada par está lo suficientemente cerca salvo el tercer cuartil. Pero esto -era de esperar debido al carácter prosaico de la segunda mitad del libro donde Ezequiel trata con oraciones necesariamente más largas sobre cuestiones de culto y arquitectura- (1973: 77). La concordancia de las estadísticas para las dos mitades (muestreadas) de Ezequiel "prueba así por primera vez que las propiedades cualitativas individuales del lenguaje encuentran su expresión cuantitativa también para los autores hebreos bíblicos". Esto es desconcertante. (1) Suponiendo que haya una discrepancia genuina, no bastará con explicarla simplemente. (2) Incluso suponiendo que se haya demostrado satisfactoriamente que Ezequiel es homogéneo en cuanto a la longitud de la oración, el resultado es para dos muestras de un libro, no para "autores bíblicos hebreos".

Radday luego divide Isaiah en trozos y calcula los descriptores de distribución de la longitud de la oración para cada uno. Más ojo: -La longitud de la oración por sí sola justifica la suposición de dos Isaías- (1973: 83).

Radday es consciente de que se necesitan pruebas, más que impresiones. Desafortunadamente, se dan pocos detalles de las pruebas que usa y los resultados se informan de manera confusa. Dado que sus pruebas implican suposiciones no probadas sobre la distribución de la longitud de la oración, analizamos los datos mediante el análisis de tablas de contingencia. Debido a que las dos partes de Isaías (capítulos 1-35 y 40-66) cada una involucra casi mil oraciones, nuestro análisis implica un paso adicional más allá de lo que se hizo en C.3. Cuando las tablas de contingencia involucran recuentos grandes, las desviaciones bastante leves de los datos observados de los datos generados por el modelo se magnifican, lo que lleva a valores bastante grandes de X 2 . (Recuerde que cuando X 2 está por debajo de un umbral crítico, las desviaciones de los datos observados de los datos estimados basados ​​en un modelo se atribuyen a fluctuaciones estadísticas; cuando X 2 excede el umbral, el modelo es rechazado por considerar inadecuadamente las observaciones). Para evitar ser engañados, usamos una medida de asociación, la v de Cramér, definida en nuestro caso por, donde Nes el número de datos de nuestra tabla (Andersen y Forbes 1986a: 23, 240). Esta cantidad varía entre cero y uno. Un valor de cero indica que las variables de fila y columna de la tabla de contingencia son independientes; los cambios en uno no tienen ningún efecto en el otro. Un valor de uno indica que las dos variables están completamente asociadas, que covarían al unísono. Los valores intermedios implican grados intermedios de asociación. Para las dos partes de Isaías, obtenemos v Isaías = .29; para las dos muestras de Ezequiel, encontramos v Ezequiel= .33. Estos resultados indican que el grado de asociación entre las porciones de Isaías y la longitud de la oración (.29) es en realidad menor que entre las muestras de Ezequiel y la longitud de la oración (.33). Por lo tanto, las razones de Radday para asumir dos Isaías conducen por igual, o incluso un poco más fuertemente, a la suposición de dos Ezekiels, contra la afirmación de Radday de que Ezekiel es homogéneo.

Radday next ocupa la longitud de las palabras, medida tanto por la sílaba como por el recuento de fonemas. Concluyendo un estudio de trabajos anteriores, comenta (1973: 99):

Resumiendo, se puede decir, con la debida cautela, que la longitud de las palabras no es una característica lo suficientemente específica para decidir problemas de autoría impugnada, siempre que esté aislada. Sin embargo, junto con otros parámetros y dentro de las limitaciones de la lingüística estadística en general, la prueba parece lo suficientemente confiable como para intentarla.

Radday basa su análisis en: (1) pares de muestras de 250 palabras extraídas de cinco "libros bíblicos irrefutablemente homogéneos": Oseas, Ezequiel, Job, Ester y Deuteronomio (500 palabras por libro de control) y (2) tríos de 250- muestras de palabras para cada una de sus seis secciones de Isaías. (Muchos eruditos encuentran que estos libros de control no son homogéneos). Para los libros de control, las distribuciones de longitud de palabras muestran "una consistencia notable", excepto en el caso de Job. "Pero incluso allí, la incongruencia entre las dos muestras es aún menor que dentro de Tolstoi". Evidencia de Guerra y PazHabiendo puesto su mente en reposo, Radday procede a examinar el comportamiento de Isaías. "Hay que admitir que [los] datos son, para nuestro propósito, deficientes". A su vez, se introducen varias otras medidas que incorporan información sobre la longitud de las palabras para el recuento de sílabas y fonemas. Nuestra explicación de todas estas medidas consumiría una cantidad de espacio injustificable. Por lo tanto, solo tomaremos una de las favoritas de Radday, la redundancia, que persistentemente etiqueta erróneamente como entropía relativa. (La redundancia es uno menos la entropía relativa.) Una exposición adecuada del concepto de redundancia está más allá del alcance de este ensayo. Para los propósitos actuales, la redundancia puede verse como una medida del "desperdicio" relativo de símbolos en un texto dado. Si se pueden eliminar muchos símbolos sin perder el mensaje de un texto, ese texto tiene un gran valor de redundancia. Si la supresión de incluso un solo símbolo afectaría el significado de un texto, ese texto tiene cero redundancia. Estimar la redundancia de un texto está plagado de sutilezas (Johnson 1979: 221-23). Nos centraremos en solo uno de estos. Las estimaciones de redundancia de Radday para Isaiah se dan en la Tabla 6.

Cuadro 6.

Redundancias de secciones de Isaías

Sección

Capítulos

Redundancia

I

1-12

.30

II

13-23

.30

III

24-35

.36

IV

40-48

.24

V

49-57

.35

VI

58-66

.31

Para Radday, la tabla -prueba la unidad de las Secciones I y II, muestra la Sección III como una parte no relacionada del ‘Primero’ Isaías, y la Sección IV como aislada del resto del libro- (1973: 127). Pero el peso de estas conclusiones es incluso más ligero de lo que sugieren sus orígenes impresionistas. Se nos informa que hay cinco palabras de seis sílabas en Isaías (Radday 1973: 94). Las estimaciones de redundancia se basan en tres muestras de 250 palabras de cada parte de Isaías, y dependen fundamentalmente de la suerte de probar palabras de seis sílabas.(Esto se debe a que el estimador de redundancia que usa Radday implica el logaritmo del número máximo de sílabas observado en cualquier palabra en una muestra). Da la casualidad de que las muestras de Radday pierden la palabra de seis sílabas en la Sección I y la de la Sección II. pero incluya los únicos en las Secciones III, V y VI. (La sección IV no tiene una palabra de seis sílabas.) Ahora suponga que la suerte del sorteo hubiera atrapado las dos palabras de seis sílabas en las secciones I y II en lugar de las dos en las secciones III y VI, un cambio en el muestreo de cuatro palabras en muestras por un total de 4.500 palabras (0,1 por ciento). Entonces, las estimaciones de redundancia serían las que se muestran en la Tabla 7.

Cuadro 7.

Redundancia de secciones de Isaías bajo muestreo alternativo

Sección

Capítulos

Redundancia

I

1-12

.38

II

13-23

.37

III

24-35

.36

IV

40-48

.24

V

49-57

.35

VI

58-66

.23

¿Estos resultados probarían la unidad de las Secciones I, II y III, mostrarían la Sección V como una parte dislocada del -Primero- Isaías, y mostrarían las Secciones IV y VI como formando Deutero-Isaías? Toda una revolución basada en el muestreo o no muestreo de cuatro palabras. Claramente, es mejor no utilizar un criterio tan sensible.

A continuación, Radday considera las frecuencias relativas de las partes del discurso. Sus resultados para libros únicos y homogéneos

parecen arruinar toda esperanza de haber descubierto aquí un medio diacrítico para determinar la autoría. A pesar de esto, las categorías de palabras se contaron para Isaías [141]. . . Las secciones I y II son muy similares y las secciones I y IV son diametralmente opuestas entre sí [154].

Entonces, un criterio que falla en los textos de control se usa sin embargo en Isaías como si las pruebas de control hubieran probado su validez. El abandono triunfa sobre el método del sonido.

Luego vienen las transiciones entre las partes del discurso. La comparación de las frecuencias de transición entre pares de muestras de un libro determinado revela algunos casos en los que las tasas difieren de una muestra a otra. La tabla de recuentos de desviaciones excesivas de frecuencias de transición.

marcas solo tienen dificultades para ir en el supuesto de que las secciones I [capítulos 1-12] y III [Capítulos 24-35] tienen un origen común y, exactamente! -dos veces tan difícil de creer que Isaías ben Amoz que seguramente escribió Sección I [capítulos 1-12] también escribió la Sección IV [capítulos 40-48].

Elimina las transiciones para "partes del discurso que se realizan débilmente", es decir, para preposiciones más pronombres libres, conjunciones libres, residua y oclusivas. Pero conserva los nombres propios y los verbos no finitos a pesar del hecho de que estos son más débiles que algunas de las categorías que ha eliminado. Las medidas de similitud de Radday son ad hoc. Cuando examinamos las transiciones (a través del análisis de la tabla de contingencia), encontramos que las Secciones III (capítulos 24-35) y V (capítulos 49-57), para las cuales Radday no muestra resultados, son más similares que las Secciones I (capítulos 1- 12) y II (capítulos 13-23), para los que sí muestra resultados. ¿Debemos concluir que las secciones III y V tienen el mismo autor?

Considera las frecuencias de las partículas. Los -textos de control de Radday son libros generalmente considerados más o menos homogéneos- (1973: 198). Se incluye Génesis. Para sus seis secciones básicas, Radday encuentra que el porcentaje del vocabulario contribuido por sus cuatro partículas (su "f r ") es como se muestra en la Tabla 8.

Cuadro 8.

Frecuencias de partículas en secciones de Isaías

Sección

I

II

III

IV

V

VI

f r :

6.03

6.04

4,74

2,55

5.79

4,96

De la mesa, concluye:

El carácter especial de la Sección IV. . . se convierte en absoluto aquí: Su porcentaje no solo es el más bajo, sino en un 50% más bajo que el segundo más bajo (Sección III). Además, los valores de las Secciones I y II son nuevamente idénticos hasta un centésimo de pc [porcentaje], la Sección III se comporta de manera diferente a sus vecinas y las Secciones V y VI al menos no son diferentes.          

Los errores aritméticos estropean esta tabla. Según los recuentos de Radday, debería leerse como se muestra en la Tabla 9.

Cuadro 9.

Frecuencias de partículas corregidas en secciones de Isaías

Sección

I

II

III

IV

V

VI

f r :

6,00

4.09

4,71

2,41

5.80

4,94

Las secciones I y II ya no muestran un extraño acuerdo.

Y así continúa a través del vocabulario relacionado con la "guerra", la riqueza del vocabulario y la excentricidad del vocabulario. Se introducen criterios de poder de especificación de autor no probado. No se explican los métodos. Se generan resultados. La evidencia confirmatoria se presenta con fanfarria. La evidencia contraria se explica. Finalmente (1973: 274-76), Radday llega a cinco conclusiones:

a) El libro se compone de dos partes, es decir, capítulos. 1-35 y caps. 40-66.     

b) Las partes más disímiles son los capítulos. 1-12 y caps. 40-48. Dado que Isaías ben Amoz fue sin duda alguna el autor del primero, no puede haber escrito el segundo.     

c) Cap. 13-23 debe atribuirse con un alto grado de probabilidad al autor de los capítulos. 1-12, es decir, al mismo Isaías.     

d) Cap. 49-57 y 58-66 muestran tantas afinidades entre sí y tan pocas con el resto del libro que uno tiene que atribuirlas a otro profeta más.     

e) En cuanto a los caps. 23-35 el veredicto no es concluyente, pero pertenecen en cualquier caso a la primera parte del libro.     

La publicación del libro de Radday (y sus artículos predecesores) resultó en varios comentarios y revisiones. Almagor (1971) criticó a Radday por confiar en impresiones y no en estadísticas, por ignorar la interrelación de sus datos y por llegar a conclusiones subjetivas. Drake (1971) vio el trabajo de Radday como prematuro, ya que no sabemos cuántos parámetros definen inequívocamente el estilo de un autor, ya que no entendemos las causas de las variaciones intraautor (audiencia, forma, intención, salud?), Ya que ha Aún no se ha demostrado que dos obras del mismo autor sean necesariamente más similares que dos de autores diferentes, y dado que no sabemos qué tan bien un escritor puede imitar a otro. Morton (1974) predijo la resistencia al trabajo de Radday, ya que los eruditos bíblicos "rara vez son numerarios y tienden a resistirse a la introducción de nuevas técnicas que les obligan a mejorar su educación en un nivel". Deseaba que Radday hubiera demostrado la validez de sus pruebas, las hubiera explicado con más detalle y hubiera ilustrado las diferencias demostradas dando ejemplos del texto. Pero que la evidencia apoyó las conclusiones -es difícil de dudar. . . A partir de ahora, los estudios del Antiguo Testamento en general y el estudio de Isaías en particular se encuentran en un terreno nuevo ". Wagner (1977) consideró que la mayor parte del libro estaba dedicada a -un tratamiento estadístico bien documentado y, de hecho, provocativo. . . Si está dispuesto a pensar en las implicaciones de revisar su enfoque, debe leer el volumen ". -Deseaba que Radday hubiera demostrado la validez de sus pruebas, las hubiera explicado con más detalle y hubiera ilustrado las diferencias demostradas dando ejemplos del texto. Pero que la evidencia apoyó las conclusiones -es difícil de dudar. . . A partir de ahora, los estudios del Antiguo Testamento en general y el estudio de Isaías en particular se encuentran en un terreno nuevo ". Wagner (1977) consideró que la mayor parte del libro estaba dedicada a -un tratamiento estadístico bien documentado y, de hecho, provocativo. . . Si está dispuesto a pensar en las implicaciones de revisar su enfoque, debe leer el volumen ". -Deseaba que Radday hubiera demostrado la validez de sus pruebas, las hubiera explicado con más detalle y hubiera ilustrado las diferencias demostradas dando ejemplos del texto. Pero que la evidencia apoyó las conclusiones -es difícil de dudar. . . A partir de ahora, los estudios del Antiguo Testamento en general y el estudio de Isaías en particular se encuentran en un terreno nuevo ". Wagner (1977) consideró que la mayor parte del libro estaba dedicada a -un tratamiento estadístico bien documentado y, de hecho, provocativo. . . Si está dispuesto a pensar en las implicaciones de revisar su enfoque, debe leer el volumen ". A partir de ahora, los estudios del Antiguo Testamento en general y el estudio de Isaías en particular se encuentran en un terreno nuevo ". Wagner (1977) consideró que la mayor parte del libro estaba dedicada a -un tratamiento estadístico bien documentado y, de hecho, provocativo. . . Si está dispuesto a pensar en las implicaciones de revisar su enfoque, debe leer el volumen ". A partir de ahora, los estudios del Antiguo Testamento en general y el estudio de Isaías en particular se encuentran en un terreno nuevo ". Wagner (1977) consideró que la mayor parte del libro estaba dedicada a -un tratamiento estadístico bien documentado y, de hecho, provocativo. . . Si está dispuesto a pensar en las implicaciones de revisar su enfoque, debe leer el volumen ".

Es casi imposible determinar la solidez de los datos de Radday ya que los capítulos, versículos y partes de versículos se han eliminado y los oráculos retenidos de los capítulos 36-40 aparentemente injertados en los capítulos 1-12.

Radday hace uso repetidamente de muestras bastante cortas de textos de control (y de hecho de Isaías). En su trabajo se aprecia poca preocupación por los efectos del tamaño de la muestra. Hay que registrar un profundo malestar al respecto. En cuanto al estado de los métodos, las salvaguardas evidentes en su uso y las conclusiones basadas en sus resultados, el comentario anterior ha demostrado reiteradamente errores fundamentales que desacreditan sus resultados.

B. Adams y Rencher (1973). En respuesta a la revisión favorable de Morton del trabajo de Radday sobre Isaiah, Adams (1974) presentó tres críticas: (1) la ausencia de una base adecuada para un método no es excusa para usarlo como si todo estuviera bien; (2) la responsabilidad del uso adecuado de las pruebas estadísticas recae en sus usuarios; (3) Las conclusiones de Radday no se derivan de sus datos. Adams informó: -aplicamos procedimientos estadísticos a los datos que nos proporcionó Radday y descubrimos que los resultados no respaldaban sus conclusiones- (1974: 86). Adams se refiere aquí a su trabajo de tesis doctoral que él y su director de tesis publicaron en resumen (Adams y Rencher 1973).     

Adams y Rencher (1973: 151; en adelante AR) señalan que los métodos para atribuir un texto a uno de un par de autores contendientes, para cada uno de los cuales uno tiene un cuerpo de trabajo conocido, son bastante diferentes de los métodos apropiados para el Problema de Isaías, donde se determina el número de autores. Esta es una idea sólida.

AR (1973: 151) sostiene que para el problema de Isaías, las medidas de asociación (similitud) son más apropiadas que las medidas de diferencias significativas. Ésta es una afirmación errónea. Las medidas de similitud tienden a centrarse en la cohesión entre objetos, mientras que las medidas de diferencia significativa tienden a centrarse en su aislamiento. Pero AR ciertamente es libre de usar medidas de similitud.

Para determinar el grado de similitud entre dos textos, la RA se basa en la correlación del momento del producto. (También utilizan la llamada distancia de Mahalanobis, que aporta poco más que complejidad a su análisis). La correlación producto-momento mide el grado de similitud entre dos objetos en términos de sus atributos en una escala que va de menos uno a más uno. Cuanto más similares sean los textos, más cerca de más uno estará la correlación del momento del producto derivada de sus valores de atributo.

En cuanto a la elección de los atributos de texto específicos del autor, AR afirma (1973: 151): "El uso de prefijos es quizás uno de los elementos estilísticos más pertinentes para determinar la autoría en el texto hebreo". Su argumento bastante discutible es que las preposiciones proclíticas hebreas corresponden a palabras funcionales propensas al hábito en inglés, muy utilizadas en estudios sobre la autoría de obras en inglés (por ejemplo, Mosteller y Wallace 1984) y, por lo tanto, son buenos marcadores para especificar el autor. Recuerde que Herdan (1966: 172-74), Damerau (1975) y Morton (1978: 102) han advertido contra el uso de palabras funcionales. Por ahora, sigamos el argumento de A-R, manteniendo en suspenso el escepticismo con respecto a la especificidad del autor de las frecuencias de preposición proclítica.

Con los atributos característicos seleccionados (preposiciones proclíticas hebreas) y con una medida de asociación decidida (correlación del momento del producto), los analistas se encaminaron hacia sus dos objetivos (1973: 151):

1) compare las dos secciones principales del libro de Isaías entre sí y con cada una de ellas. . . once textos de control (comparación entre textos) y 2) examinan el libro de Isaías y cada uno de los 11 textos de control para comprobar la coherencia interna del estilo.

[39]

Este es un escenario sólido. Las muestras se extraen de los once libros de control (Jeremías, Ezequiel, Oseas, Amós, Miqueas, Habacuc, Zacarías, Malaquías, Daniel, Esdras y Nehemías); Isaías se divide en dos partes (Isa-A [capítulos 1-39] e Isa-B [capítulos 40-66]); por razones técnicas, sólo se estudian dieciocho de las veinticuatro preposiciones proclíticas que encuentran en Isaías. De esto surgen -quizás los resultados más destacados de este estudio- (1973: 152), las correlaciones entre los libros de control y partes de Isaías. La Tabla 10 muestra estos.

Cuadro 10.

Correcciones entre (muestras de) libros

Isa-A

Isa-B

Jer

Ezek

Hos

Amós

Micrófono

Hab

Zech

Mal

Dan

Esdras

Isa-B

.98

Jer

.97

.93

Ezek

.96

.93

.95

Hos

.93

.96

.85

.87

Amós

.97

.91

.98

.98

.85

Micrófono

.97

.97

.92

.95

.95

.94

Hab

.99

.99

.96

.95

.94

.95

.98

Zech

.93

.86

.96

.93

.78

.97

.85

.90

Mal

.98

.97

.92

.96

.89

.93

.94

.96

.91

Dan

.96

.96

.91

.90

.90

.89

.89

.95

.88

.97

Esdras

.96

.93

.98

.91

.83

.94

.89

.95

.93

.92

.95

Neh

.92

.86

.93

.88

0,75

.92

.83

.990

96

.91

.88

.95

Con base en estos resultados, AR concluye (1973: 154):

La correlación entre las dos secciones del libro de Isaías fue de 0,98, una indicación de la similitud general en las tasas de uso y no uso de prefijos. Solo dos de las otras 77 comparaciones fueron tan altas. Esto es menos de lo que cabría esperar de las leyes del azar cuando se hacen tantas comparaciones.

De hecho, solo dos correlaciones fueron más altas que entre las secciones de Isaías; en total, siete "eran tan altos". Los investigadores habían evitado previamente una interpretación probabilística del coeficiente de correlación, y ahora es curioso que se les diga que un par particular de correlaciones que exceden al encontrado entre las secciones de Isaías solo se espera "de las leyes del azar". Dado que las grandes correlaciones se utilizan para defender la unidad de Isaías, uno se pregunta por qué el argumento no se extiende a afirmar que el único escritor de Isaías también escribió Habacuc.

A continuación, AR determine un conjunto de nueve preposiciones proclíticas que son "las más únicas para ambas secciones de Isaías". Las correlaciones resultantes se presentan a tres lugares de decimal y revelan que ninguna correlación iguala el valor de 1.000 obtenido para la comparación de las dos secciones de Isaías. "Las comparaciones estadísticas de intratexto con variación entre textos indicaron que existe un alto grado de similitud de autoría para el libro de Isaías". No está claro cómo llegaron a las preposiciones proclíticas "más singulares". De hecho, toda esta línea de investigación implica un "manejo especial". Si los investigadores no hubieran recurrido a la precisión ficticia implícita en una visualización de correlaciones con tres decimales, sus resultados (redondeados a dos decimales) habrían incluido nueve pares de textos con correlaciones de 1,00.

Siguen breves notas de estudios de raíces hebreas exclusivas de Isaías, de frecuencias de raíz y de repetición de frases. Sin embargo, el peso del estudio se mantiene en la frecuencia del uso de preposición proclítica.

En cuanto a la solidez de los datos en los que se basa el estudio, hemos utilizado el texto de Isaías de Andersen-Forbes (AF) para determinar la incidencia de las preposiciones proclíticas. Dado que las tasas de los once textos de control se basan en muestras aleatorias, no podemos verificarlas directamente. La RA no da recuentos reales, sino que enumera recuentos por cinco mil palabras. Las comparaciones para las preposiciones proclíticas simples se muestran en la Tabla 11.

Cuadro 11.

Frecuencias de prefijos preposicionales

Isa-A

Isa-B

Prefijo

Sentido

Arkansas

AF

Arkansas

AF

B-

en

688

715

676

673

h-

los

7552

787

467

466

w-

y

1834

1965

1884

2056

k-

igual que

231

236

219

223

l-

para

700

702

863

855

metro-

de

446

300

521

403

Algunas de las diferencias son considerables. Para las preposiciones proclíticas compuestas, los recuentos son pequeños y AR encuentra algunos que nosotros no y viceversa. Cuando usamos nuestro inventario de preposiciones proclíticas para calcular la correlación entre Isa-A e Isa-B, obtenemos el mismo valor (.98) que AR. Los datos parecen suficientemente sólidos.

Cuando pasamos a la adecuación de los tamaños de las muestras, nos encontramos con el error estadístico fatal de este trabajo. AR (1973) no da el tamaño de las muestras extraídas de los textos de control. La tesis de Adams (1972) contiene la información necesaria: muestras de 500 palabras. Estas son muestras pequeñas, especialmente cuando se están estimando las frecuencias de algunos eventos bastante raros. El punto puede concretarse mediante dos tipos de experimentos.

Suponga que en lugar de usar los textos completos para obtener frecuencias de preposición proclítica para Isaías, AR hubiera usado muestras de 500 palabras. Utilizando un muestreo aleatorio, extraemos una muestra de 500 palabras de Isa-A y una de Isa-B. Usando las frecuencias de preposición proclítica basadas en estas muestras, obtenemos una correlación intratexto para Isaías de .87. Las correlaciones para cuarenta y siete de los cincuenta y cinco pares de textos de control superan este valor. ¿Debemos inferir la desunión de Isaías?

Alternativamente, para mostrar los efectos del tamaño de la muestra, podemos derivar frecuencias de preposición proclítica para Jeremías y Ezequiel basadas en los libros completos. Las correlaciones para los libros completos están más cerca de la unidad que las basadas en muestras, como muestra la Tabla 12. (Para fines comparativos, las correlaciones de AR se incluyen entre paréntesis).

Cuadro 12.

Correlaciones de muestras grandes entre libros

Texto

Isa-A

Isa-B

Jer

Isa-B

.98 (.98)

Jer

.98 (.97)

.94 (.93)

Ezek

1,00 (0,96)

.97 (.93)

.99 (.95)

La superior homogeneidad intratexto de Isaías en comparación con la homogeneidad intertexto de los libros de control encontrados por AR es un artefacto resultante de un muestreo inadecuado.

C. Weil (1974). Weil (1974: 29) desconfía del uso de estadísticas inferenciales. Rechaza gran parte del trabajo en lingüística estadística porque, subyacente, encuentra suposiciones incorrectas de que los datos obedecen a la distribución gaussiana y porque considera que las pruebas se utilizan incorrectamente. (Afirma que la prueba de chi-cuadrado se suele utilizar fuera de su dominio propio). -Estas consideraciones nos han llevado, por el momento, a rechazar los métodos de análisis estadístico para centrarnos en modelos que se ajusten mejor a los datos que estamos tratando- ( 1974: 30).     

Weil opta por los métodos de estadística descriptiva: análisis factorial, clasificación automática, análisis multidimensional. Si bien su acusación del uso de estadísticas inferenciales es demasiado general, su uso de estadísticas descriptivas es ciertamente aceptable. Sin embargo, presentar presentaciones de datos y desafiar al lector a que vea patrones en ellos no es tan diferente de usar los métodos de estadística inferencial de una manera poco estricta como la que adelantaron Adams y Rencher. En ambos casos, las probabilidades no están vinculadas a los resultados y el lector debe decidir qué es significativo.

Con respecto al problema de Isaías, Weil evita prejuzgar la composición de los subconjuntos de texto trabajando en términos de pequeños bloques de capítulos (capítulos 1-5, 6-10,…, 60-66). Para sus atributos de texto, Weil usa las frecuencias de ocurrencia de las cien palabras más frecuentes en Isaías. Cuando los bloques de capítulos se clasifican automáticamente mediante la agrupación jerárquica, surgen cuatro grupos principales: los capítulos 41 a 50, los capítulos 1 a 35, los capítulos 51 a 66 y los capítulos 36 a 40. Deutero-Isaiah y el resto se separaron primero; luego el resto se divide en Proto- y Trito-Isaías, con los capítulos paralelos de Reyes -transitorios-. Más recientemente, utilizando las ochenta y nueve palabras más frecuentes, obtiene un patrón idéntico de agrupamiento (Weil 1979). Weil ha demostrado que, en términos de palabras de uso frecuente, Isaías se agrupa de maneras bastante interesantes.

El "agrupamiento jerárquico" mencionado anteriormente utiliza una tabla de atributos de texto para calcular distancias entre porciones de texto. Estos, a su vez, se utilizan para agrupar los textos en grupos explícitos. Un conjunto alternativo de enfoques, los llamados "métodos geométricos", aproxima las relaciones de distancia de los textos en un espacio de baja dimensión y deja que el observador humano determine qué elementos se agrupan naturalmente en grupos (Andersen y Forbes 1986b; Freedman , Forbes y Andersen 1991). Weil y sus colegas han utilizado uno de estos métodos, el análisis de correspondencia, para analizar a Isaiah (Weil 1979, un resumen extendido de una exposición más completa en Weil, Salem y Serfaty 1976). Encuentran que este método, que funciona en términos de capítulos individuales, produce resultados bastante acordes con los obtenidos a través de la agrupación jerárquica. Más significativamente, validan sus resultados estudiando las distancias de los distintos capítulos a los centros de los grupos de los que parecen ser miembros. También demuestran que la representación de sus datos en un plano no distorsiona indebidamente las relaciones de distancia entre los capítulos. Desde la perspectiva estadística, este es un buen trabajo.

En lo que respecta a la solidez de los datos, generalmente se considera que los textos de Weil son muy precisos. Parece seguro que los tamaños de muestra utilizados son suficientes para la tarea: trabajando con bloques de uno, tres y cinco capítulos y utilizando métodos jerárquicos y geométricos, Weil y su grupo demuestran la estabilidad de sus resultados. Sus métodos se conocen bien. No están exentos de dificultades, pero al realizar estudios subsidiarios de validación, Weil y sus colegas han implementado excelentes garantías. Pero como el análisis se basa completamente en recuentos frecuentes de palabras, no está claro qué conclusiones se justifican.

2. Composición oral y escrita: Bee (1971). Bee ha adelantado dos nociones que encuentra útiles en el análisis de textos bíblicos. Primero, la frecuencia relativa de los verbos permite -identificar y clasificar las unidades del texto. . . Es necesario suponer que en muchos casos una diferencia de origen irá acompañada de una diferencia en la frecuencia de los verbos -(Bee 1971: 406). Pero los cambios en el tema también pueden afectar la frecuencia de los verbos, "por lo que el ejercicio de un juicio educado es esencial". Si x i es el recuento de palabras hasta el i- ésimo verbo, entonces la gráfica de i versus x i , la tabla de suma acumulativa     de verbos, se pueden examinar para detectar cambios en la tasa de uso de verbos al discernir cambios en la pendiente de la trama. Esto lleva a la segunda noción de Bee: las palabras átonas están ligadas a sus sucesores por el maqqeph, el "guión" hebreo. Si uno se centra en cuestiones gramaticales, puede tratar el maqqeph como un espacio, de modo que cada par suturado se cuente como dos palabras; si uno se centra en la pronunciación, un par suturado puede contarse como una palabra. Por lo tanto, se pueden construir dos gráficos que indiquen la tasa de uso de verbos: (1) el gráfico MS ( maqqeph por separado) y (2) el gráfico MC ( maqqeph conjunto). Si la atención del autor estaba en las palabras como unidades gramaticales, como se esperaría para la composición escrita, la tabla de MS sería apropiada para el análisis; si la atención se centrara en las palabras a medida que se pronuncian, como se esperaría para la composición oral, la tabla de MC sería apropiada. Si el "gráfico correcto" muestra una trama que está bien ajustada por una línea recta, entonces no hay ningún cambio evidente en el estilo. Al determinar cuál es la mejor tabla para un conjunto de verbos (ya sea mediante inspección o mediante pruebas estadísticas), se puede determinar el origen, escrito u oral, de un texto. Y al discernir cuándo cambia la pendiente del segmento de línea que mejor se ajusta, se pueden subdividir los textos en unidades.

En una serie de artículos, Bee aplica estas ideas para determinar cuál de un par de textos paralelos es el anterior, para evaluar la unidad de varios pasajes, para determinar el pedigrí de varias fuentes documentales (Bee 1971; 1972; 1973; 1979).

Todo esto es indudablemente inteligente, pero está abierto a críticas devastadoras. MP Weitzman (1981) ha presentado un análisis bastante detallado del método de Bee. Sus críticas son que: (1) las pruebas imputan al lenguaje una aleatoriedad insostenible; (2) la definición de "verbo" no es sencilla; (3) los cambios en la frecuencia de los verbos pueden tener causas distintas a los cambios en la autoría (que Bee siempre ha admitido); (4) la ubicación de maqqephes bastante variable, lo que hace que su uso no sea confiable; (5) el "trabajo sobre Deuteronomio muestra esa selectividad y manipulación que genera desconfianza en las estadísticas"; (6) "la prueba del origen compuesto es irremediablemente demasiado sensible"; (7) -la prueba de composición oral o escrita también es demasiado sensible-. Bee (1983) responde a las críticas de Weitzman, refutando con éxito la primera, pero el resto debe mantenerse. (Bee también ha propuesto una fórmula de datación de texto profético. Consulte la crítica de Becking [1980] con la respuesta de Bee [1980], que proporciona la entrada a una serie de artículos).

3. La hipótesis documental. una. Chenique (1967). La mayor parte de la tesis inédita de Chenique se ocupa de los problemas abordados mientras él y GE Weil preparaban textos hebreos para el análisis informático. Un capítulo (III, cuarenta y cuatro páginas) ofrece resultados esquemáticos de los análisis de los primeros once capítulos del Génesis. Él subdivide los capítulos elegidos de tres maneras: (1) CREACIÓN (1: 1-6: 8, 146 versos) versus Diluvio (6: 9-11: 32, 153 versos) versus TOUT; (2) YAVISTE ( J , 147 versos) versus ELOHISTE ( P , 152 versos), como lo define la Biblia de Jerusalén; (3) Génesis capítulo 1 (31 versículos) versus 3 (24 versículos) versus 9: 1-17. Las dos primeras subdivisiones involucran amplias muestras de texto.     

Como características relevantes del texto, investiga las frecuencias de los grafemas, la longitud de las palabras (en "letras"), la entropía del texto y las relaciones entre el rango de las palabras y la frecuencia. No hay ningún intento de evaluar el poder de especificación del autor de estas características del texto. (Sin embargo, se cita el trabajo de Pierre Guiraud).

Las pruebas estadísticas utilizadas son bastante simples y consisten en verificaciones de superposición de intervalos de confianza y pruebas de significancia de diferencias en las medias (pruebas t). Este tipo de pruebas fueron utilizadas anteriormente por Morton y más tarde por Radday y asociados. (Desde entonces han sido rechazados por Weil por considerarlos inapropiados). Desafortunadamente, Chenique busca diferencias significativas a través de análisis marginales. Es decir, estudia el comportamiento de sus atributos para cada tipo de subdivisión por separado (CREACIÓN versus Diluvio, YAVISTE versus ELOHISTE, Capítulo 1 versus Capítulo 3, y así sucesivamente). Esta estrategia puede resultar bastante engañosa cuando existen interacciones entre los conjuntos de variables tratadas por separado.

Habiendo encontrado diferencias significativas entre YAVISTE y ELOHISTE en lo que respecta a las frecuencias de los grafemas, Chenique afirma que su explicación no es para la estadística sino para que la exégesis la determine (1967: III.5). Al encontrar que el contenido de la información (en términos de entropía de letras) es mayor en DELUGE, YAVISTE, y el Capítulo 3 que en CREATION y ELOHISTE, él comenta que la hipótesis de dos o más "lenguajes" no está probada por ello, pero se retiene para verificación posterior (1967: III.9). (Afirma que las entropías son características de un autor [1967: III.9].) Usando la proporción de elementos de vocabulario (V) a palabras totales (N), encuentra que el vocabulario del YAVISTE es más rico que el del ELOHISTE (1967: III.13).

S. Talmon caracteriza las conclusiones de Chenique así (Talmon 1985: 227): -François Chenique. . . sostiene que un análisis realizado con una calculateur électronique sustenta la Hipótesis Documental respectiva al Génesis cap. 1-11 -. Esto no reclama ni demasiado ni demasiado poco.

B. Weil (1974). Weil y sus colaboradores han estudiado el Pentateuco con cierto detalle. En sus primeros trabajos (1974: 30), analizan los capítulos del Pentateuco utilizando recuentos de grafemas. Descubren cuatro grupos, que Weil encuentra relacionados con los tipos de redacción que encarnan: (1) promulgación declarativa de la ley, (2) promulgación imperativa de la ley, (3) narrativa general y (4) informes de censos, viajes y batallas. Weil describe dos grupos, los libros del Pentateuco formando un grupo en forma de plátano que casi toca el grupo en forma de pera de los Profetas. Los capítulos de Éxodo se agrupan en términos de sus temas. Weil comenta que se han realizado análisis basados ​​en secuencias de grafemas, recuentos de palabras frecuentes y "hechos lingüísticos raros". No se dan detalles ni resultados.     

También presenta un método interesante para estudiar el tipo de discurso. Examina el comportamiento de, donde NV es el recuento de verbos en un texto, NP es el recuento de partículas y NM es el recuento de palabras ("mots"). Cuando este índice es positivo, se trata de poesía; cuando es negativo, se trata de prosa.

En otro trabajo, Weil (1981a) analiza la agrupación de los capítulos del Pentateuco y examina la distribución de partes del discurso en el Pentateuco y los tres Profetas Mayores.

C. Radday y col. (mil novecientos ochenta y dos). Primero en un artículo de revista (Radday et al. 1982) y luego en una monografía (Radday y Shore 1985), Radday y sus colegas han retomado la Hipótesis Documental para Génesis. Debido a las serias implicaciones de este estudio, primero abordamos varios temas del A.3 anterior.     

Solidez de los datos: cada palabra del Génesis del texto Letteris de 1852 está etiquetada con sus especificaciones gramaticales, su longitud en fonemas, sus afijos, de qué fuente documental proviene (J, E o P), su cita y si es habla directa humana (H) o habla directa divina ( D ) o narración (N).

Es con la elección de la versión de la Hipótesis documental que uno debe tomar una decisión extenuante. Radday nos asegura que si surgen resultados sólidos de sus fuentes, uno podría esperar resultados bastante similares usando asignaciones "en una forma algo modificada" (1985: 19). Usando el texto de Génesis de Andersen-Forbes, encontramos las diferencias entre las asignaciones de Radday y Eissfeldt (de su Hexateuchsynopsis ) que se muestran en la Tabla 13. Las filas son asignaciones de Radday y las columnas son de Eissfeldt. Por lo tanto, Radday asigna 9.100 palabras a J, de las cuales Eissfeldt asigna 7.247 a J, 1.459 a E y 394 a P. Y así sucesivamente. (No hemos compuesto ni números ni topónimos. Hemos eliminado 573 palabras formateadas como poesía en BHS ).

Cuadro 13.

Asignaciones de documentos de Radday versus Eissfeldt

Eissfeldt

Radday

J

mi

PAG

Total

J

7247

1459

394

9100

mi

3283

3221

282

6786

PAG

517

21

3551

4089

Total

11047

4701

4227

19975

En general, el treinta por ciento de las asignaciones de Radday difieren de las de Eissfeldt. (Para J, 20%; para E, 53%; para P, 13%). Fundamentalmente, el análisis de Radday no confronta una Hipótesis Documental que la mayoría reconocería.

En un movimiento loable para permitir que otros evalúen su trabajo de manera más completa, Radday y colaboradores (1985: 237-52) han publicado los datos sobre los que se basa su libro. Hemos verificado dos de sus muestras de texto, la Muestra n. ° 1 y la Muestra n. ° 29. (Estos fueron seleccionados porque son las primeras muestras narrativas de P y de J [1985: 25].)

Study of Sample # 29 (1985: 241) revela un tipo de dificultad. Su entrada más pequeña es .485 por ciento, que consideramos que corresponde a un recuento de uno dividido por el tamaño de la muestra, lo que arroja un tamaño de muestra de 206 palabras. Según la Tabla 1.3 (1985: 25), los seres materiales en Génesis 2: 5 y se extiende hasta Génesis 2:19; de acuerdo con la Tabla 1.1 (1985: 20), el material comienza en Génesis 2: 4. El tramo desde Génesis 2: 4 hasta Génesis 2:19 tiene 211 palabras. Eliminar Gen 2: 4 reduce la muestra a 206 palabras. (No solo Gen 1: 2-2: 3 se ha descartado por el motivo equivocado de que es poesía, sino que Gen 2: 4 se ha descartado inadvertidamente). Como prueba, contamos el número de artículos definidos y el número de posibles portadores del artículo. La proporción de estos dos es el criterio n. ° 18 de Radday. Obtenemos, que es exactamente lo que tiene Radday. Pero hay un lapso involucrado en la definición de la Muestra # 29. Es la primera de las muestras narrativas de J (NJ). De hecho, hay veintisiete palabras de habla divina (DJ) incrustadas en la muestra, dieciocho palabras en Génesis 2:17 y nueve palabras en Génesis 2:18. Por tanto, la muestra no es pura narrativa J. Esto genera preocupaciones sobre el etiquetado de los datos en general.

El examen de la muestra n. ° 1 plantea otras preocupaciones. Radday analiza en términos de cincuenta y cuatro "criterios" calculados para cada muestra de texto (de alrededor de 200 palabras). Los criterios # 1- # 10 dan las frecuencias relativas, en la muestra de texto dada, de palabras que tienen dos, tres,. . . , diez y más de diez fonemas. Por lo tanto, agregar las entradas de la tabla de una muestra para los primeros diez criterios juntos debería producir un 100%, como ocurre. (Tenga en cuenta que estos diez criterios no son independientes, ya que el conocimiento de nueve cualquiera permite determinar el décimo).

Radday divide su vocabulario en cinco familias (sustantivo [N], verbo finito [F], verbo no finito [V], preposición o pronombre [P], y -conjunciones coordinadas, adverbios y el resto- [C]). La agrupación de preposiciones y pronombres es extraña, al igual que la naturaleza "ragbag" de la clase C. Utiliza "L" para los nombres propios, "en la mayoría de los recuentos se suman a N". Añadiendo un símbolo para la parada al final de un verso (S), calcula las frecuencias relativas de las treinta y cinco transiciones teóricamente posibles entre estas seis categorías. Los criterios # 20- # 25 describen las transiciones de sustantivo a algo (Ν (ρ)?); # 26- # 31, transiciones finitas de verbo a algo (F (ρ)?); # 32- # 37, transiciones no finitas de verbo a algo (V (ρ)?); # 38- # 43, transiciones de preposición o pronombre a algo (Π (ρ)?); # 44- # 49, transiciones de paja a algo (Χ (ρ)?); y # 50- # 54,

El estudio de los datos de transición conduce a varias observaciones inquietantes. (1) En la tabla resumen del conjunto de criterios (1985: 30), Radday tiene "conjunciones subordinadas" en todos los lugares donde esperamos la clase de residuo (C). Probablemente se trate de un error tipográfico, pues se pretendía -conjunción de coordinación- (C). En cualquier caso, existe un problema. Sabemos por la entrada del criterio n. ° 17, y hemos verificado directamente, que hay una conjunción subordinada en la muestra, seguida de un verbo finito. Pero, para la Muestra n. ° 1, la tabla da el criterio n. ° 45, transición C (ρ) F, como .0000.

(2) Una clasificación gramatical que incluye una categoría para "el resto" es exhaustiva. Por lo tanto, si se suman los criterios # 20- # 54, se debe obtener una suma del 100%. Uno no lo hace. Por ejemplo, estos criterios suman 77,05% para la Muestra n. ° 1. Se han omitido algunas transiciones. ¿Cuáles son y por qué faltan?     

(3) Radday (1985: 29) nos informa que de los cincuenta y cuatro criterios, – nos. 24, 30, 36, 42-49 y 54, en total once, no se realizan en absoluto en Génesis ". De hecho, hay muchas entradas distintas de cero para el criterio n. ° 43. Los diez criterios restantes son precisamente aquellos que involucran la clase residual de palabras (C). Esto significa que la clase que consiste en -coordinar conjunciones, adverbios y el resto- (C) está vacía en Génesis. Esto no puede ser. ¿Qué ha fallado y en qué etapa del análisis?     

Tamaño de la muestra: se adopta desde el principio un tamaño de muestra de 200 palabras por muestra (1985: 23). Más tarde, se da una razón para usar muestras de 200 palabras (1985: 60-61), pero este tamaño de muestra es el resultado de la decisión inexplicable "que establece el criterio de que no menos de tres muestras estén disponibles para cualquiera de las nueve celdas" en el Cuadro de las combinaciones de documento y tipo de discurso (1985: 62). De hecho, doslas celdas, ni una como dice Radday, tienen muy pocas palabras para permitir tres muestras de 200 palabras. Tenga en cuenta que muchos de los valores de criterio para una muestra se determinarán muestreando considerablemente menos de 200 palabras. Por ejemplo, el criterio de artículo definido (# 18) es la fracción de palabras que tiene el artículo en relación con todas las que en teoría podría. En todo el libro de Génesis, aproximadamente el 20 por ciento de las palabras son portadores potenciales del artículo definido. Así, en promedio, las cifras de incidencia del artículo definido se basan en unas cuarenta palabras por muestra, un número bastante limitado. Recuerde los efectos espurios de las muestras de 500 palabras producidas en el estudio de Adams y Rencher.

Para resumir, el uso de una versión atípica de la Hipótesis Documental, un conjunto de datos evidentemente mal etiquetado, criterios que se dice incorrectamente que son iguales a cero, y el uso de muestras demasiado pequeñas nos hacen desconfiar de los resultados obtenidos por Radday y colaboradores. . Estas importantes limitaciones de ninguna manera agotan la lista de problemas que uno encuentra en el estudio de Génesis.

Si hubiera suficiente espacio, se podrían discutir otros problemas que involucren: ignorar la posibilidad de eventos escandalosos (1985: 13); una actitud más feliz con respecto a criterios adicionales (1985: 27); ignorar la posibilidad de que los criterios sean supra-estilísticos(1985: 28); un uso de innumerables métodos muy similares, como si el peso de las pruebas resultantes de ellos se acumulara cada vez más; modificación de métodos debido a -resultados decepcionantes-, sin mostrar la naturaleza de la decepción para que el lector la juzgue (1985: 97); uso de dendrogramas con encadenamiento desenfrenado (1985: 135); uso de visualizaciones bidimensionales para resultados de escalado multidimensional debido a que las dimensiones superiores son más difíciles de interpretar (1985: 146); introducción de medidas elaboradas y mal motivadas de riqueza y concentración de vocabulario (1985: 191-214); presentación plagada de errores tipográficos de la distribución de Sichel (1985: 259-60); y lo más grave de todo, la repetida confianza en análisis marginales potencialmente muy engañosos (1985: passim). Véanse también las críticas de Portnoy y Petersen (1984a, 1984b) y Weitzman (1986a).

Poder demostrado de los métodos: En la monografía, hay varias referencias a trabajos anteriores que han demostrado la validez de varios enfoques (1985: 13, 27-29, 45). Las referencias son a la monografía discutida anteriormente sobre Isaías (Radday 1973), a un artículo extenso sobre Zacarías (Radday y Wickmann 1975) y a un tratamiento de los jueces (Radday, Leb, Wickmann y Talmon 1977). Las limitaciones de espacio impiden la exposición del trabajo sobre Zacarías y Jueces. Los métodos son esencialmente los mismos que se usaron en el estudio de Isaías. Y, al igual que en ese estudio, hay que cuestionar tanto las medidas utilizadas como las conclusiones basadas en su aparente comportamiento.

Salvaguardias en el uso de métodos: Nuestra verificación al azar de dos de las muestras de datos arrojó problemas que sugerían que no se utilizaron las salvaguardas adecuadas. (Observamos el comentario de Radday sobre el descubrimiento de un error importante en sus análisis iniciales de Génesis [1985: 31].)

Conclusiones extraídas de los resultados estadísticos: La actitud de Radday y sus colaboradores con respecto a las inferencias extraídas de sus conjuntos de criterios ha fluctuado considerablemente. En su primer trabajo, Radday confiaba en que sus criterios eran específicos del autor (Radday 1970: 320; 1973: passim) e inferido varios autores (Radday 1970: 324; 1973: 274). El trabajo sobre Zacarías fue más cauteloso. Se admitieron los posibles efectos de confusión de los cambios en el género, el tema y la edad del autor, y se anunció la detección de la cesura con autoría múltiple sólo implícita (Radday y Wickmann 1975: 42, 47, 54). En un estudio sobre el uso del artículo definido, algunas variaciones en las tasas de uso se atribuyeron a cambios "en el tema y / o tipo literario", mientras que otras variaciones se atribuyeron a diferentes autores (Radday y Shore 1977: 25, 26). En el trabajo sobre Jueces, la introducción de criterios como específicos del autor se justificó con frases como -uno se siente inclinado a creer eso. . . " y ". . . se puede suponer que lo caracteriza, aunque el asunto hasta ahora no ha sido suficientemente examinado -(Radday, Leb, Wickmann y Talmon 1977: 478). Sin embargo, los resultados de las pruebas estadísticas se consideraron específicos del autor (Radday, Leb, Wickmann y Talmon 1977: 492; también Radday y Shore 1977).

En un interesante estudio de los Cinco Rollos, se consideró que las diferencias en la concentración de vocabulario (la fracción del texto representada por las cincuenta palabras más frecuentes) se debían a diferentes autores o diferentes etapas en la carrera de un autor (Radday y Pollatschek 1978). Un estudio de concentración de vocabulario de los profetas postexílicos (Radday y Pollatschek 1980) se vio gravemente estropeado por una exposición inadecuada del método. Una encuesta que introdujo un nuevo par de medidas de características de vocabulario concluyó con un breve tratamiento de riqueza y concentración en Génesis. Se produjo una gráfica de riqueza versus concentración que indujo a los investigadores a maravillarse (Pollatschek y Radday 1981: 222 y figura 6). Nótese la trama bastante diferente, basada en el mismo material, en Radday, Shore, Pollatschek y Wickmann (1982: 477).

En la investigación de Génesis, todos los resultados que muestran la falta de homogeneidad entre los documentos se explican. Dejemos que una cita extensa lo aclare (1985: 182-83).

Concentrémonos en la distinción que acabamos de mencionar entre NJ [narración J] y NE [narración E]. No es necesario concederle demasiado peso. . . NE toma el relevo cuando NJ se desvanece y precisamente donde se produce una ruptura en el tratamiento de las figuras centrales. . . No es de extrañar, entonces, que NJ no sea uniforme con NE, y no hay razón por la que los dos deban atribuirse a dos manos diferentes. Por lo tanto, para cada intento, J y E parecen ser uno. Llevando este razonamiento más lejos, se puede agregar que explica también el comportamiento lingüístico aparentemente singular de P. . . El carácter único de P debe deberse a la falta de equilibrio en el tema entre lo que los Documentarios atribuyen al Escritor Sacerdotal y lo que atribuyen al Yahvista o al Elohista.

Uno puede imaginarse fácilmente a algún otro investigador que no haga los argumentos anteriores y concluya que los textos bajo estudio son de múltiples manos. Aquí vemos crudamente la extrema flexibilidad que desacredita a la mayoría de los estudios de autoría. Incluso cuando el trabajo estadístico se realiza con gran rigor (lo que rara vez es el caso), las inferencias finales con demasiada frecuencia implican una arbitrariedad descarada.

Rosenhouse (1986) ha escrito un resumen mínimamente crítico de este trabajo. Parunak (1987) encuentra encomiable el enfoque de equipo, el uso de múltiples métodos para evaluar los datos y la inclusión de los datos en los que se basan los resultados. Lamenta lo esquemático de la exposición estadística, la dependencia excesiva del supuesto de independencia, el no uso de los métodos más sensibles de exploración de datos y la infrautilización de las pantallas gráficas. Weitzman (1986a) resume brevemente el trabajo, enfocándose en muchas de sus imperfecciones básicas. Su juicio final es que -la afirmación final [de Radday y Shore] de ‘evidencia masiva de que Génesis es una unidad’ ( p. 190) es una inconsecuencia masiva . "

D. Otros (1977-1986).     Para completar, incluimos, con un mínimo de comentarios, un aviso de otros trabajos relacionados con la Hipótesis Documental. (1) Deist (1977) concluye que la fuente L y la fuente J de Eissfeldt no son diferentes al examinar las diferencias en las frecuencias de ocurrencia de varias características sintácticas. (La estadística inferencial se usa de manera imprecisa). (2) Houk (1983) estudia las distribuciones de longitud de palabras (en términos de sílabas) en Génesis 12-23. Analizando J, E y P -se encuentra una diferencia significativa entre los tres tipos de material- (1983: 192). Cuando se comparan las mitades de J, de E y de P (homogeneidad intradocumento), -la desunión evidenciada va en contra de cualquier unidad de composición a gran escala- (1983: 193). (No se abordan las implicaciones de la falta de homogeneidad significativa dentro del documento para juzgar la falta de homogeneidad entre documentos.géneros y las once fuentes de Eissfeldt. (Los comentarios interpretativos son escasos y muy cautelosos).

4. Otras investigaciones de estilo / uso. Hoftijzer (1981) investiga la incidencia de H-locale (el sufijo -h en un movimiento indicador sustantivo hacia un lugar) en relación con los lugares donde podría aparecer y examina la importancia de diferentes tasas de uso a través de la superposición de intervalos de confianza. (Parunak [1983] ha escrito una revisión útil de este trabajo). Parunak (1981) utiliza métodos de agrupamiento y pruebas de significado de agrupamiento de formas creativas para producir lo que él denomina "concordancias pictóricas". Sus tramas permiten ver      grupos de vocabulario en los textos. Al examinar sus "gráficas de densidad" en busca de intersecciones, bien podrían generarse nuevas hipótesis. Forbes (1987) estudia una medida de organización sintáctica (entropía de la parte del discurso) en la Biblia hebrea, buscando modelos simples de organización de texto y diferenciando los textos mediante el condicionamiento de unidades sintácticas posteriores o anteriores.

5. Ortografía en la Biblia hebrea: Andersen y Forbes (1986a). Andersen y Forbes (1986a; en adelante AF) investigan si suficiente individualidad ortográfica, con respecto al uso de ortografía defectuosa y completa , ha sobrevivido a las copias repetidas para permitir que partes del texto recibido se agrupen en términos de patrones ortográficos.     

La preparación de datos necesaria para ejecutar el estudio es sustancial. Primero, según lo que se sabe sobre el desarrollo de la ortografía hebrea, ciertas vocales se marcan como históricamente fijadas (1986a: 126-49). Por ejemplo, dado que todas menos seis de las 55,439 vocales terminales de palabra en la Biblia hebrea están escritas plene (1986a: 111), la clase de vocales terminales de palabra se considera históricamente fija. Dado que tales vocales no contienen información discriminatoria, se eliminan de un examen más detenido. Hay otras vocales en lexemas particulares que pueden escribirse defectuosas o plene,pero que siempre o casi siempre se escriben de una manera. Estos también se descartan como vacíos con el fin de discriminar porciones de textos. Si se puede afirmar, con un 95% de confianza, que la ortografía desviada de un lexema ocurriría en menos del 1% de las apariciones de un lexema en un texto enorme, la vocal asociada se declara fija en su ortografía por motivos estadísticos (1986a: 151- 54). Por ejemplo, kōl ("todos") se escribe defectuoso 852 veces y plene una vez. Se considera de ortografía fija.

Después de eliminar las vocales fijas, el texto de ketib contiene 108,943 vocales que fueron oportunidades para la elección de la ortografía en algún momento del desarrollo de la ortografía hebrea. Dado que las vocales se desarrollaron a lo largo de líneas individuales, AF define a continuación sesenta y cinco tipos de vocales y etiqueta cada oportunidad según su tipo (1986a: 162-204). Algunos tipos de vocales se refieren a clases de palabras ("Tipo 1. Sufijo -ı̄- en verbos finitos"), mientras que otros son específicos de un solo lexema ("Tipo 33. Nota accusativi ˒ōt " ). Como hay evidencia de que algunas ortografías pueden estar condicionadas por el "nivel de estrés", cada oportunidad de elección de ortografía se etiqueta como acentuada ("bajo", "medio", "alto").

Habiendo especificado sesenta y cinco tipos de vocales, tres niveles de acentuación y dos opciones de ortografía, el texto se divide a continuación en porciones. Aquí se encuentra el problema del tamaño de la muestra (1986a: 205-13). Para un análisis completo (en términos de las cuatro variables), los requisitos estadísticos exigen que no se utilicen más de setenta y seis porciones. El texto de la Biblia hebrea se divide en consecuencia, manteniendo las muestras de aproximadamente el mismo tamaño cuando sea posible y haciendo divisiones en términos de interés académico (Proto-, Deutero-, Trito-Isaiah) o tema (Joseph Cycle como una sola porción). Cuando el análisis involucra un solo tipo (como cuando uno pregunta si la elección de ortografía y la porción están asociadas para un tipo de vocal dado), se pueden permitir menos porciones debido a la escasez de oportunidades de vocales que componen el tipo.

Los análisis estadísticos pueden dar lugar a resultados muy engañosos si no se tienen en cuenta variables importantes. Por lo tanto, el paso preparatorio final es examinar el comportamiento de la ortografía en términos de un trío de posibles "variables de confusión": proximidad, frecuencia local y acentuación. El intervalo entre instancias de un lexema casi no tiene ningún efecto sobre la elección de la ortografía (1986a: 214-7). Por tanto, la proximidad no es una variable de confusión. Las elecciones de ortografía realizadas cuando un elemento aparece con frecuencia en una parte no difieren radicalmente de las elecciones realizadas cuando ocurre con poca frecuencia. Por tanto, los efectos de la frecuencia local parecen poco importantes (1986a: 221-30). El estrés, sin embargo, ejerce una influencia en la elección de la ortografía para ciertos tipos de vocales. Sin embargo, los efectos generales del estrés son bastante desconcertantes. La ortografía de las vocales bajo estrés "alto" no es más frecuenteplene que el de las vocales bajo el acento "medio" o "bajo" (1986a: 230-39). Por lo tanto, se utilizan formas de contabilizar los efectos del estrés sin tratar la categoría de estrés como se ordenó .

Habiendo sido avezados, etiquetados y examinados los datos en busca de influencias de confusión, el análisis principal procede en dos etapas: (1) determinación para cada tipo de si muestra interacción entre las opciones de ortografía y parte del texto, y (2) agrupación de la porciones de texto en grupos de afinidad que exhiben prácticas ortográficas similares.

Demostrar que los patrones de ortografía han sobrevivido a la transmisión implica: (1) evaluar la mejor manera de manejar el estrés para un tipo de vocal dado, (2) analizar el comportamiento de la ortografía en las porciones (buscar anomalías y decidir si estas son el resultado de los efectos dominantes de algunos lexemas o reflejan una asociación generalizada de la elección de la ortografía y la porción), y (3) mostrar evidencia de que los patrones de la elección de la ortografía realmente dependen de la porción (1986a: 240-87). Uno encuentra que algunos tipos de vocales muestran una asociación de parte de elección de ortografía falsa (debido a una práctica de ortografía aberrante extremadamente localizada) y otros no muestran asociación. Pero la mayoría de los tipos de vocales, especialmente aquellos para vocal / ō /, manifiestan una asociación entre la elección de ortografía y la porción. Este es el primer resultado importante de nuestro análisis.

Habiendo demostrado que la información útil sobre la elección de la ortografía permanece en nuestros textos, la tarea final es agrupar las porciones del texto en grupos que exhiban prácticas similares. Una forma útil de visualizar las similitudes en los patrones de ortografía de las partes del texto es calcular las medidas de sus distancias y usarlas para formar dendrogramas. Figura STA.03muestra uno de estos dendrogramas. Puede verse como un árbol tendido de lado, con las ramas apuntando hacia la izquierda y la raíz hacia la derecha. Sus hojas son porciones de texto. Sus ramas enlazan porciones de texto similares o grupos de porciones. Las hojas unidas por ramas -altas- (hacia la izquierda) en el árbol son muy similares. Las ramas que se unen "bajas" en el árbol enlazan conglomerados relativamente diferentes. Por lo tanto, en la figura STA.03 vemos que las dos porciones de texto más similares son Éxodo 25-31 y Éxodo 32-40, ya que las ramas unen estas hojas en el nivel más alto (más a la izquierda) del árbol. Josué 1-12 es la parte más dispar ya que es la última hoja que se une al árbol.

Tal dendrograma contiene detalles que tienen sentido inmediato, como cuando partes del mismo libro resultan ser similares. Otras uniones son sorprendentes e invitan a un examen más detenido. Por ejemplo, las porciones de Isaías están más cerca de porciones de otros libros que entre sí.

La práctica de la ortografía en el Pentateuco lo distingue del resto de la Biblia hebrea (1986a: 288-308). El Pentateuco prefiere ortografías anticuadas en muchos casos. Este es el segundo resultado importante de nuestro análisis.

Podría haber varias explicaciones para esto. Quizás los manuscritos de esta parte de la Biblia provienen de una comunidad diferente, una con diferentes prácticas de ortografía, que la fuente del resto. Quizás gozó de una mayor veneración y por eso se resistió a la modernización. Quizás sea más antiguo que el resto. Se necesitan más estudios.

En cuanto a la solidez del texto legible por máquina utilizado, el texto AF se ha verificado repetidamente y mediante múltiples enfoques durante los quince años durante los cuales se ha creado. Su texto consonántico se ha comparado con el de Weil. Las asignaciones gramaticales también se han revisado minuciosamente. En general, los diversos recuentos de palabras y categorías del texto están de acuerdo con los recuentos publicados de Weil (1981b).

Los tamaños de las muestras se han determinado de acuerdo con prácticas estadísticas conservadoras y se han realizado análisis con una variedad de tamaños de muestra para permitir la evaluación de la solidez de los resultados.

Los métodos inferenciales utilizados para demostrar que la ortografía en los textos no ha sufrido una aleatorización total debido a errores de copia son aplicables en condiciones muy generales (1986a: 123). Los métodos descriptivos de agrupamiento son bien conocidos y sus resultados se han verificado mediante métodos geométricos (escalamiento multidimensional clásico [1986a: 330]). La principal limitación de los métodos de agrupación, su formación de agrupaciones, independientemente de los datos que se les proporcionen, se ha controlado mediante la agrupación con conjuntos de datos relacionados y mediante el cálculo de medidas que indican la fiabilidad de la agrupación (1986a: 300-8). Además, se han utilizado otras medidas y métodos de distancia, lo que ha dado lugar a resultados bastante similares (Andersen y Forbes 1986b; Freedman, Forbes y Andersen 1991).

La precisión de los resultados ha sido salvaguardada llevando a cabo la preparación de los datos utilizando utilidades informáticas estándar, realizando comprobaciones cruzadas y recuentos para verificar la integridad de los datos en cada etapa, y utilizando un paquete estadístico estándar para el análisis (Andersen y Forbes 1989). .

Se han descrito deficiencias conocidas en el Epilog (1986a: 329-31) y se han tomado medidas para abordarlas (Freedman, Forbes y Andersen 1991). En cuanto a las conclusiones extraídas de los resultados de los análisis estadísticos (1986a: 309-28), otros deben ser los jueces finales.

Se han publicado varias reseñas del trabajo. Campbell (1986) esboza los objetivos y métodos del trabajo y presenta algunos de los resultados. Concluye: -A pesar de sus intentos de mantenerlo inteligible, este no es un libro para pusilánimes; pero es un libro importante que debe estudiarse con detenimiento ". MS Smith (1987), al resumir el trabajo, encuentra áreas que siente que necesitan más atención: los detalles de la práctica ortográfica en las inscripciones, los roles respectivos de las elecciones de los escribas (si las hay) y las alteraciones del copista, los efectos de la distribución del texto en los resultados. Espera -que un estudio más a fondo aborde más directamente las cuestiones de los orígenes textuales, la transmisión, etc. . . Barr (1988) critica severamente el trabajo por imponer las teorías y categorías ortográficas de Cross y Freedman sobre los datos de tal manera que anula "el valor de la computadora como un medio de objetividad". Comenta que Andersen y Forbes dan la impresión de que "no tienen idea en absoluto de que existen otras posibilidades". Para Barr, la ortografía "depende, en gran medida, no del momento en que se escribió el pasaje, sino de la historia textual del libro en el que se encuentra". Contrariamente a la afirmación de Barr, Andersen y Forbes conocen bien esta hipótesis y la consideran ampliamente (Andersen y Forbes 1986a; 102-4, 115-16, 124-25, 241-46, 289). Barr pregunta repetidamente por qué falta cierta información. Gran parte está presente, como revelan los índices. Barr lamentablemente malinterpreta el libro, en gran parte porque aborda el problema de los análisis estadísticos -dejando de lado el material matemático- (ignorando dos quintas partes del libro). Hamilton (1988) afirma que Andersen y Forbes -logran admirablemente cada uno de [sus] objetivos principales. . . Sus resultados son a menudo sorprendentemente recientes, incluso si sus métodos estadísticos a veces pueden resultar incomprensibles para un lector general ". Está frustrado por la falta de ejemplos extensos de cada tipo de vocal, y la falta lo hace "sospechar hasta qué punto [él] puede confiar en [las] ​​estadísticas finales". Concluye: -La densidad estadística y la opacidad de Sus resultados son a menudo sorprendentemente recientes, incluso si sus métodos estadísticos a veces pueden resultar incomprensibles para un lector general ". Está frustrado por la falta de ejemplos extensos de cada tipo de vocal, y la falta lo hace "sospechar hasta qué punto [él] puede confiar en [las] ​​estadísticas finales". Concluye: -La densidad estadística y la opacidad de Sus resultados son a menudo sorprendentemente recientes, incluso si sus métodos estadísticos a veces pueden resultar incomprensibles para un lector general ". Está frustrado por la falta de ejemplos extensos de cada tipo de vocal, y la falta lo hace "sospechar hasta qué punto [él] puede confiar en [las] ​​estadísticas finales". Concluye: -La densidad estadística y la opacidad deLa ortografía en la Biblia hebrea puede impedir que ocupe su merecido lugar como obra de referencia estándar sobre este tema complejo y difícil ". Pardee (1988) tiene dos críticas principales a Andersen y Forbes: (1) Limitan el término ortografía a matres lectionis, desarrollando sólo mínimamente un -modelo claro de las condiciones culturales que crearon las convenciones para el uso de ml- (2 ) No "toman en serio la diversidad de la ortografía en las inscripciones hebreas preexílicas tardías". Pardee concluye: -Estamos muy en deuda con ellos. . . para la presentación confiable de los datos y el análisis estadístico que han proporcionado -.

E. Observaciones finales     

A estas alturas, ha surgido un patrón. Con angustiosa regularidad hemos visto: (1) una falta de sensibilidad a las sutilezas de la especificación del tamaño de la muestra, (2) una interpretación errónea de las investigaciones previas como justificación para el trabajo actual de uno cuando no lo hacen, (3) una actitud arrogante con respecto a la necesidad de salvaguardas contra percances en el procesamiento de datos, y (4) una pedagogía descuidada en la que los conceptos básicos no se explican o se explican de manera descuidada. Lo más preocupante es que hemos visto en repetidas ocasiones investigaciones embarcadas con amplias afirmaciones de objetividad que exige asentimiento solo para ser testigos de su invalidación final a través de súplicas especiales y atención selectiva a los resultados. No es necesario ser un estadístico para detectar cuándo un resultado ha dependido de que el investigador / taumaturgo y la audiencia parpadeen en momentos críticos.

Una acusación severa, muy a menudo cierta de los análisis estadísticos. Por ejemplo, se han encontrado errores estadísticos en aproximadamente la mitad de los artículos publicados en un conjunto representativo de revistas médicas norteamericanas (Glantz 1981: 6-9). Refiriéndose a la literatura estadística general, Mallows y Tukey (1982: 163) preguntan por qué los argumentos basados ​​en estadísticas a menudo no logran convencer. Responden que: (1) los procedimientos a menudo se explican de manera inadecuada, (2) las conclusiones a menudo son sospechosas porque los datos no cumplen claramente los supuestos subyacentes a los métodos, y (3) la relevancia de los datos para las preguntas formuladas a menudo no se ha determinado. demostrado. Las deficiencias de la investigación bíblica estadística son típicas de los análisis estadísticos en general.

La solución no es renunciar a las estadísticas, sino que sus usuarios expliquen su trabajo con claridad, hagan explícitos los supuestos sobre los que se basan sus análisis y renuncien a la pretensión de que las conclusiones basadas en estadísticas carecen de presupuestos. Muchas áreas de los estudios bíblicos pueden beneficiarse enormemente de la aplicación cuidadosa de métodos estadísticos.

Bibliografía

Adams, LL 1972. Un análisis estadístico del libro de Isaías en relación con el problema de Isaías. Diss. Universidad Brigham Young.

—. 1974. Correspondencia: Estadística literaria. Association for Literary and Linguistic Computing Bulletin 2: 85-87.

Adams, LL y Rencher, AC 1973. La opinión crítica popular del problema de Isaías a la luz del análisis de estilo estadístico. Estudios de Computación en Humanidades y Comportamiento Verbal 4: 149-57.

Adams, WJ y Adams, LL 1977. La deriva del lenguaje y la datación de pasajes bíblicos. HS 18: 160-64.

Almagor, R. 1971. Sobre la unidad del libro de Jesias a la luz de los artículos por YT Radday. Leš 36: 51-66 (hebreo).

Amphoux, C.-B. 1981. Quelques témoins grecs des formes textuelles les plus anciennes de l’Epitre de Jacques: le groupe 2138 (OU 614) . NTS 28: 91-115.

Andersen, FI 1976. Estilo y autoría. Melbourne.

Andersen, FI y Forbes, AD 1986a. Ortografía en la Biblia hebrea. Roma.

—. 1986b. Más estudios en ortografía hebrea. Leer en la Conferencia sobre la historia de la ortografía hebrea, Universidad de California en San Diego, abril de 1986.

—. 1987. El lenguaje del Pentateuco. Páginas. 231-67 en Herramientas informáticas para textos antiguos, ed. HVD Parunak. Winona Lake, IN.

—. 1989. Métodos y herramientas para el estudio de la sintaxis del Antiguo Testamento. Páginas. 61-72 en Actas del Segundo Coloquio Internacional: Biblia y Computadora. París y Ginebra.

Barr, J. 1988. Revisión de la ortografía en la Biblia hebrea por FI Andersen y AD Forbes. JSS 33: 122-31.

Becking, R. 1980. Fórmula de citas de Bee y el libro de Nahum. JSOT 18: 100-4.

Bee, RE 1971. Métodos estadísticos en el estudio del texto masorético del Antiguo Testamento. Revista de la Royal Statistical Society ser. A 134: 611-22.

—. 1972. Un estudio estadístico de la perícopa del Sinaí. Revista de la Royal Statistical Society ser. A 135: 406-421.

—. 1973. El uso de métodos estadísticos en los estudios del Antiguo Testamento. VT 23: 257-72.

—. 1979. Un estudio de Deuteronomio basado en propiedades estadísticas del texto. VT 29: 1-22.

—. 1980. Fechar el libro de Nahum: una respuesta al artículo de Bob Becking. JSOT 18: 104.

—. 1983. Estadística y crítica de fuentes. VT 33: 483-88.

Brainerd, B. 1979. Pronombres y género en el drama de Shakespeare. Computadoras en las Humanidades 13: 3-16.

—. 1980. La cronología de las obras de Shakespeare: un estudio estadístico. Computers in the Humanities 14: 221-230.

Buch, KR 1969. Una nota sobre la longitud de las oraciones como variable aleatoria. Páginas. 76-79 en Statistics and Style, ed. L. Doležel y RW Bailey. Nueva York.

Cadbury, HJ 1965. Revisión de La estructura de Lucas y Hechos por AQ Morton y GHC MacGregor. JBL 84: 337-38.

Campbell, AF 1986. Revisión de la ortografía en la Biblia hebrea por FI Andersen y AD Forbes. AusBR 34: 86-88.

Chenique, F. 1967. Principes et méthodes de l’étude de la bible massorétique sur les calculateurs électroniques. Doctor. Diss. Universidad de Estrasburgo.

Chomsky, N. 1957. Estructuras sintácticas. La haya.

Damerau, FJ 1975. El uso de frecuencias de palabras funcionales como indicadores de estilo. Computers in the Humanities 9: 271-80.

Deísta, VF 1977. Stilvergleichung als literarkritisches Verfahren . ZAW 89: 325-57.

Doležel, L. 1969. Marco para el análisis estadístico del estilo. Páginas. 10-25 en Estadística y estilo, ed. L. Doležel y RW Bailey. Nueva York.

Drake, B. 1971. Preguntas sin respuesta en el análisis literario computarizado. JBL 90: 241-42.

Forbes, AD 1987. Secuencias sintácticas en la Biblia hebrea. Páginas. 59-70 en Perspectivas sobre el lenguaje y el texto. ed. EG Newing y EW Conrad. Winona Lake, IN.

Fortna, RT 1983. Revisión de The Genesis of John por AQ Morton y J. McLeman. Computadoras en las Humanidades 17: 154.

Freedman, DN; Forbes, AD; Andersen, FI 1991. Estudios de ortografía hebrea y aramea. Winona Lake, IN.

Gaston, L. 1973. Horae Synopticae Electronicae: Estadísticas de palabras de los evangelios sinópticos. Missoula.

Glantz, SA 1981. Primer of Biostatistics. Nueva York.

Good, IJ 1969. Estadísticas del lenguaje: Introducción. Páginas. 567-81 en Enciclopedia de Lingüística, Información y Control, ed. AR Meetham. Oxford.

Grayston, K. y Herdan, G. 1959. La autoría de las pastorales a la luz de la lingüística estadística. NTS 6: 1-15.

Griffiths, JG 1969. Taxonomía numérica y algunos manuscritos primarios de los evangelios. JTS 20: 389-406.

Halle, M. 1958. Revisión del lenguaje como elección y azar por G. Herdan. Kratylos 3: 20-28.

Hamilton, GJ 1988. Revisión de la ortografía en la Biblia hebrea por FI Andersen y AD Forbes. JBL 107: 128-29.

Harrison, PN 1921. El problema de las epístolas pastorales. Oxford.

Herdan, G. 1960. Type-Token Mathematics. La haya.

—. 1966. La teoría avanzada del lenguaje como elección y azar. Berlina.

Hoftijzer, J. 1981. Una búsqueda de método: un estudio en el uso sintáctico de H-Locale en hebreo clásico. Leiden.

Houk, CB 1979. Sílabas y salmos: un análisis lingüístico estadístico. JSOT 14: 55-62.

—. 1981. Un estudio lingüístico estadístico de Ezequiel 1.4-3.11 ZAW 93: 76-85.

—. 1983. Un análisis de la estructura de las sílabas de Génesis 12-23. Páginas. 191-201 en WLSGF, ed. CL Meyers y M. O’Connor. Winona Lake, IN.

Johnson, RL 1979. Medidas de diversidad de vocabulario. Páginas. 213-27 en Advances in Computer-Aided Literary and Linguistic Research, ed. DE Ager y col. Birmingham.

Kenny, A. 1986. Un estudio estilométrico del Nuevo Testamento. Oxford.

Knox, TM 1963. La computadora y el Nuevo Testamento. SEÅ 28: 111-16.

Lord, RD 1958. de Morgan y el estudio estadístico del estilo literario. Biometrika 3: 282.

MacGregor, GHC y Morton, AQ 1961. La estructura del cuarto evangelio. Edimburgo.

Mallows, CL y Tukey, JW 1982. Una descripción general de las técnicas de análisis de datos, enfatizando sus aspectos exploratorios. Páginas. 111-72 en Algunos avances recientes en estadística, ed. JT de Oliveira y B. Epstein. Londres.

McCasland, SV 1961. Revisión de la estructura del cuarto evangelio por GHC MacGregor y AQ Morton. JBL 80: 283-84.

Meier, P. y Zabell, S. 1980. Benjamin Peirce y Howland Will. Revista de la Asociación Estadounidense de Estadística 75: 497-506.

Mendenhall, TC 1901. Una solución mecánica de un problema literario. Popular Science Monthly 9: 97-105.

Morgenthaler, R. 1958. Statistik des neutestamentlichen Wortschatzes. Zurich.

—. 1971. Statistische Synopse. Zurich.

Morton, AQ 1963. Una computadora desafía a la iglesia. The London Observer Weekend Review 3 de noviembre de 1963: 21.

—. 1965. La autoría de la prosa griega. Revista de la Royal Statistical Society ser. A 128: 169-233.

—. 1974. Revisión de La unidad de Isaías a la luz de la lingüística estadística por YT Radday. Association for Literary and Linguistic Computing Bulletin 2: 101-3.

—. 1978. Detección literaria: cómo demostrar autoría y fraude en literatura y documentos. Nueva York.

—. 1986. Once. Una prueba de autoría basada en palabras que no se repiten en la muestra. Computación literaria y lingüística 1: 1-8.

Morton, AQ y MacGregor, GHC 1965. La estructura de Lucas y Hechos. Nueva York.

Morton, AQ y McLeman, J. 1966. Paul, the Man and the Myth. Londres.

—. 1980. El Génesis de Juan. Edimburgo.

Mosteller, F. y Wallace, D. 1984. Inferencia clásica y bayesiana aplicada: el caso de los documentos federalistas. 2d ed. Nueva York.

Neumann, KJ 1990. La autenticidad de las epístolas paulinas a la luz del análisis estilo-estadístico. Atlanta.

Pardee, D. 1988. Revisión de la ortografía en la Biblia hebrea por FI Andersen y AD Forbes. CBQ 50: 276-80.

Parunak, HVD 1981. Prolegómenos a las concordancias pictóricas. Computadoras en las Humanidades 15: 15-36.

—. 1983. Revisión de A Search for Method por J. Hoftijzer. JBL 102: 297-98.

—. 1987. Revisión de Génesis: un estudio de autoría en lingüística estadística asistida por computadora por YT Radday y H. Shore. JBL 106: 518-19.

Pollatschek, MA y Radday, YT 1981. Riqueza y concentración de vocabulario en la literatura bíblica hebrea. Association for Literary and Linguistic Computing Bulletin 8: 217-31.

Portnoy, SL y Petersen, DL 1984a. Textos bíblicos y análisis estadístico: Zacarías y más allá. JBL 103: 11-21.

—. 1984b. Génesis, Wellhausen y la computadora: una respuesta. ZAW 96: 421-25.

Radday, YT 1970. Dos pruebas estadístico-lingüísticas computarizadas sobre la unidad de Isaías. JBL 89: 319-24.

—. 1973. La unidad de Isaías a la luz de la lingüística estadística. Hildesheim.

Radday, YT; Leb, G .; Wickmann, D .; y Talmon, S. 1977. El libro de los jueces examinados por la lingüística estadística. Biblica 58: 469-99.

Radday, YT y Pollatschek, MA 1978. Experimentos computarizados con los cinco rollos. Revue de l’organisation internationale pour l’étude des langues anciennes par l’ordinateur 2: 1-35.

—. 1980. Riqueza de vocabulario en libros post-exiliados. ZAW 92: 333-46.

Radday, YT y Shore, H. 1977. Una investigación sobre la homogeneidad del libro de los jueces mediante el análisis discriminante. Linguistica Biblica 41: 21-34.

—. 1985. Génesis: un estudio de autoría. Roma.

Radday, YT; Shore, H .; Pollatschek, MA; y Wickmann, D. 1982. Genesis, Wellhausen and the Computer. ZAW 94: 467-82.

Radday, YT y Wickmann, D. 1975. La unidad de Zacarías examinada a la luz de la lingüística estadística. ZAW 87: 30-55.

Romesburg, HC 1984. Análisis de conglomerados para investigadores. Belmont.

Rosenhouse, J. 1986. Revisión de Génesis: un estudio de autoría en lingüística estadística asistida por computadora por YT Radday y H. Shore. Lingüística computacional 12: 310-11.

Sachs, L. 1984. Estadística aplicada: Manual de técnicas. 2d ed. Nueva York.

Smith, MS 1987. Revisión de la ortografía en la Biblia hebrea por FI Andersen y AD Forbes. RB 94: 267-69.

Smith, MWA 1983. Experiencia reciente y nuevos desarrollos de métodos para la determinación de la autoría. Boletín de la Asociación de Computación Literaria y Lingüística 11: 73-82.

—. 1985. Una investigación del método de Morton para distinguir a los dramaturgos isabelinos. Computadoras en las Humanidades 19 (1): 3-21.

—. 1986. Hapax Legomena en posiciones prescritas: una investigación de propuestas recientes para resolver problemas de autoría. Computación literaria y lingüística 2: 145-52.

Solages, B. de. 1958. Synopse grecque des évangiles. Leiden.

—. 1972. Critique des évangiles et méthode historique. Toulouse.

—. 1973. La composición de los évangiles. Leiden.

Tallentire, DR 1971. Modelado matemático en estilística: su alcance y limitaciones generales. Páginas. 117-28 en The Computer in Literary and Linguistic Research, ed. RA Wisbey. Cambridge.

Talmon, S. 1985. Evaluación de un erudito de la Biblia. Páginas. 225-35 en Génesis: un estudio de autoría de YT Radday y H. Shore. Roma.

Wagner, NE 1977. Revisión de La unidad de Isaías a la luz de la lingüística estadística por YT Radday. JBL 96: 124.

Wake, AC 1948. La autenticidad de las epístolas paulinas. HibJ 47: 50-55.

—. 1957. Distribuciones de duración de las oraciones de autores griegos. Revista de la Royal Statistical Society ser. A 120: 331-46.

Weil, GE 1974. Bible hébraïque et targum araméen. Páginas. 5-39 en Informatique et philologie, ed. P. Frajolet. Le Chesnay.

—. 1979. Analyse automatique quantifée en critique textuelle biblique: limite des analysis statistiques. Páginas. 1-22 en Actas de la Conferencia Internacional sobre Computación Literaria y Lingüística, ed. Z. Malachi. Tel Aviv.

—. 1981a. La Statistique et la Théorie des Sources du Pentateuque. Feudal.

—. 1981b. Les décomptes de versets, mots et lettres du Pentateuque selon le manuscrit B 19a de Leningrad. Páginas. 651-703 en Mélanges Dominique Barthelemy. Etudes Bibliques offertes a l’occasion de son 60e anniversaire, ed. P. Cassetti, O. Keel y A. Schenker. OBO 38. Friburgo y Gotinga.

Weil, GE y Chenique, F. 1964. Prolégoménes à l’utilisation des méthodes de statistique linguistique pour l’étude historique et philologique de la bible hébraïque et de ses paraphrases. VT 14: 344-56.

Weil, GE; Salem, A .; y Serfaty, M. 1976. Le livre d’Isaïe et l’analyse critique des sources textuelles. Vol. 3, págs. 140-60 en Pratique de l’analyse des données, ed. JP Benzécri. París.

Weitzman, MP 1971. ¿Cuán útil es la relación logarítmica de tipo / token? Journal of Linguistics 7: 237-43.

—. 1976. Las fechas en Ezekiel. HeyJ 17: 20-30.

—. 1981. Frecuencia verbal y crítica de la fuente. VT 31: 451-71.

—. 1985. El análisis de las tradiciones abiertas. Estudios de bibliografía 38: 82-120.

—. 1986a. Revisión de Génesis: un estudio de autoría de YT Radday y H. Shore. SOTSBooklist: 78-79.

—. 1986b. Les caractéristiques numériques indépendantes de la longueur du texte. Páginas. 865-78 en Méthodes quantitatives et informatiques dans l’étude des textes, ed. E. Brunet. Ginebra.

—. 1987. Revisión de un estudio estilométrico del Nuevo Testamento por A. Kenny. Computación literaria y lingüística 2: 284-85.

Williams, CB 1970. Estilo y vocabulario: estudios numéricos. Londres.

Yule, GU 1939. Sobre la longitud de las oraciones como característica estadística del estilo. Biometrika 30: 363-90.

—. 1944. El estudio estadístico del vocabulario literario. Cambridge.

      A. DEAN FORBES