Ein Zwei-Ebenen-Modell der Phonologie des Polnischen

7 downloads 131 Views 665KB Size Report
Anhand der Beschreibung der Phonetik und Phonologie des Polnischen in ... schiedenen Lautveränderungen zu erklären, die im Polnischen auftreten. So.
Computerlinguistik und Ku¨nstliche Intelligenz

Ein Zwei-Ebenen-Modell der Phonologie des Polnischen

MAGISTERARBEIT ZUR ERLANGUNG DES MAGISTER ARTIUM

im Fachbereich Sprach- und Literaturwissenschaft der Universit¨at Osnabru ¨ck

vorgelegt von Thomas Braun aus Hannover 2003

Inhaltsverzeichnis 1 Einleitung 1.1 Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Polnisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Phonetik und Phonologie . . . . . . . . . . . . . . . . . . . . . 2 Die 2.1 2.2 2.3

polnische Laut- und Schriftstruktur 9 Phonetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Phonologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Orthographie . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3 Endliche Automaten und Transduktoren 3.1 Terminologie . . . . . . . . . . . . . . . . 3.2 Grundlegende Operationen . . . . . . . . 3.3 Endliche Automaten . . . . . . . . . . . 3.4 Endliche Transduktoren . . . . . . . . . 3.5 Verwendung der Definitionen . . . . . . . 4 Phonologische Formalismen 4.1 Regeln . . . . . . . . . . . . . . . . 4.2 Generative Phonologie . . . . . . . 4.3 Two-Level-Phonologie . . . . . . . 4.4 Bewertung der Implementierbarkeit 5 Der 5.1 5.2 5.3 5.4 5.5

3 4 5 6

Regelcompiler fu ¨r PC-KIMMO Tcl . . . . . . . . . . . . . . . . . . Endliche Transduktoren in Tcl . . . Two-Level-Regeln . . . . . . . . . . Regeln f¨ ur PC-KIMMO . . . . . . . Regeldateien . . . . . . . . . . . . .

1

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . .

33 33 34 35 41 45

. . . .

47 47 48 50 53

. . . . .

56 56 59 69 80 80

2

INHALTSVERZEICHNIS 6 Die 6.1 6.2 6.3 6.4 6.5

polnische Phonologie in Zwei-Ebenen-Regeln Das Alphabet . . . . . . . . . . . . . . . . . . . . . Eindeutige Realisierungen . . . . . . . . . . . . . . Variable Realisierungen . . . . . . . . . . . . . . . . Einf¨ ugungen . . . . . . . . . . . . . . . . . . . . . . ¨ Uberpf¨ ufung der Korrektheit der Regeln . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

82 82 83 84 99 100

7 Abschließende Bemerkungen

101

A Two-Level-Regeln

105

¨ B Ubersicht u ¨ber die beiliegende CD

111

Literaturverzeichnis

116

Kapitel 1 Einleitung In der vorliegenden Arbeit stelle ich eine Modellierung der Phonologie des Polnischen vor. Die Modellierung erfolgt mit den Mitteln des Two-Level-Modells nach Koskenniemi, das zuerst in [15] beschrieben wurde. Ziel ist es, Regeln zu formulieren, mit denen aus einer abstrakten phonologischen Repr¨asentation eines Wortes die orthographische Form abgeleitet werden kann. Damit verfolge ich nicht den klassischen Weg der Phonologie, wo u ¨blicherweise statt orthographischer Formen phonetische Formen abgeleitet werden. Anhand der Beschreibung der Phonetik und Phonologie des Polnischen in Kapitel 2 k¨onnten auch Regeln zur Ableitung von phonetischen Formen angegeben werden. Die Regeln, die ich zur Ableitung orthographischer Formen aufgestellt habe, w¨aren allerdings nur zum Teil verwendbar. Der Grund daf¨ ur ist, dass einige meiner Regeln nur f¨ ur die Orthographie von Bedeutung sind, weil verschiedene Laute abh¨angig von der Umgebung, in der sie auftreten, orthographisch unterschiedlich realisiert werden. Bei der Behandlung der Phonologie des Polnischen sind vor allem die verschiedenen Lautver¨anderungen zu erkl¨aren, die im Polnischen auftreten. So lautet der endungslose1 Nominativ Singular des Wortes f¨ ur Wald“ im Pol” 2 nischen las“ , der Lokativ Singular aber lesie“. Wenn man vereinfachend ” ” annimmt, dass las“ als Endung im Lokativ Singular ie“ erh¨alt, dann muss ” ” noch erkl¨art werden, dass der Vokal im Nominativ Singular ein a“, im Lo” kativ Singular aber ein e“ ist. ” Meine Erkl¨arung f¨ ur das Beispiel ist, ein spezielles Phonem, das ich mit /æ/ bezeichne, anzunehmen. Dieses Phonem wird abh¨angig von der Umgebung, in der es sich befindet, als a“ oder als e“ realisiert. Die phonologische ” ” 1

Im Polnischen werden Flexionsformen durch Pr¨ afigierung und Suffigierung gebildet. Der Nominativ Singular wird in W¨ orterb¨ uchern als Grundform von Substantiven angegeben. 2

3

KAPITEL 1. EINLEITUNG

4

Repr¨asentation von las“ w¨are demnach /læs/3 ; dazu gibt es Regeln, die be” stimmen, in welchen F¨allen /æ/ als a“ oder als e“ realisiert wird. ” ” Eine grunds¨atzliche Schwierigkeit bei der Betrachtung der Phonologie des Polnischen ist die so genannte Erweichung von Konsonanten. Die Besonderheit dieses Prozesses ist, dass in der orthographischen (und phonetischen) Form zwar seine Auswirkung, aber nicht seine Ursache zu erkennen ist. So ist anders als in der obigen vereinfachten Darstellung das i“ in lesie“ nicht ” ” Bestandteil der Endung, sondern es ist eine durch die Orthographieregeln des Polnischen festgelegte Markierung f¨ ur die Erweichung des s“ (und hat ” somit auch keinen eigenen Lautwert, sondern beeinflusst nur die Aussprache des s“). ” Ich f¨ uhre zur Erkl¨arung der Erweichung spezielle phonologische Markierungen ein, durch die die Erweichung ausgel¨ost wird. Damit unterscheidet sich meine Erkl¨arung von der anderer Darstellungen der Phonologie des Polnischen, z. B. der von Rubach in [19]. Zur Anwendung der aufgestellten phonologischen Regeln verwende ich den Two-Level-Prozessor PC-KIMMO [1]. Weil PC-KIMMO Regeln nur in einem besonderen Format (repr¨asentiert als endliche Automaten) verarbeiten kann, habe ich zus¨atzlich ein Programm implementiert, das Two-LevelRegeln aus dem u ¨blichen Format in das Format von PC-KIMMO konvertiert.

1.1

Aufbau der Arbeit

Im verbleibenden Teil dieses ersten Kapitels gebe ich nach dieser Darstellung ¨ des Aufbaus der Arbeit einen kurzen Uberblick u ¨ber das Polnische sowie u ur diese Arbeit wichtigsten Teilbereiche der Sprachwissenschaft, ¨ber die f¨ der Phonetik und der Phonologie. Kapitel 2 gibt danach auf sprachwissenschaftlicher Ebene – d. h. un¨ abh¨angig vom Two-Level-Modell – einen Uberblick u ¨ ber Phonetik, Phonologie und Orthographie des Polnischen. In Kapitel 4 wird das Two-Level-Modell vorgestellt, mit dessen Mitteln die Modellierung der Phonologie des Polnischen erfolgen soll. Kapitel 4 behandelt auch im Vergleich zum Two-Level-Modell ein weiteres wichtiges phonologisches Modell, die generative Phonologie. Weil dem Two-Level-Modell das mathematische Modell der endlichen Automaten und Transduktoren zugrunde liegt, wird dieses vorher in Kapitel 3 behandelt. Das oben angesprochene Programm zur Konvertierung von Two-LevelRegeln wird in Kapitel 5 beschrieben. 3

In Wirklichkeit ist die Repr¨ asentation /l æs/.

KAPITEL 1. EINLEITUNG

5

Kapitel 6 greift schließlich Kapitel 2 wieder auf; dort werden die in Kapitel 2 beschriebenen phonologischen Prozesse als Two-Level-Regeln formuliert.

1.2

Polnisch

¨ Zur Einordnung des Polnischen gibt dieser Abschnitt einen Uberblick u ¨ber wichtige Merkmale der Sprache. Die Informationen stammen aus [8]. Die polnische Sprache ist eine indoeurop¨aische Sprache. Sie geh¨ort, zusammen mit dem Tschechischen, dem Slowakischen und dem Sorbischen, zum westslawischen Zweig der slawischen Sprachen. Es wird von etwa 36 Millionen Sprechern gesprochen, haupts¨achlich in der Republik Polen und den umliegenden Gebieten, durch Migration auch in den USA und in Westeuropa. Von den u ¨ brigen slawischen Sprachen unterscheidet sich das Polnische unter anderem • durch den Erhalt der Nasalvokale a“ und e“ (vgl. poln. jezyk“, ”, ”, ”, tschech. jazyk“ ‘Sprache’) zumindest noch in der Orthographie; ” • durch die feste Betonung auf der vorletzten Silbe eines Wortes, im Gegensatz z. B. zum Russischen (beweglicher Akzent) und zum Tschechischen (Akzent auf der ersten Silbe). Andererseits verf¨ ugt das Polnische u ¨ber Merkmale, die generell in slawischen Sprachen zu finden sind, und die diese von anderen indoeurop¨aischen Sprachen wie dem Deutschen abgrenzen. Hier ist vor allem ein gut ausgebautes System von Verbalaspekten zu nennen. Das Polnische kennt den imperfektiven Aspekt (zur Kennzeichnung eines andauernden Geschehens), den perfektiven Aspekt (zur Kennzeichnung eines abgeschlossenen Geschehens) und bei einer Reihe von Verben auch den iterativen Aspekt (zur Kennzeichnung eines regelm¨aßig wiederkehrenden Geschehens). Durch das Aspektsystem wird in den slawischen Sprachen die geringe Tempusdifferenzierung ausgeglichen; das Polnische verf¨ ugt u ¨ber ein Pr¨asens, ein Futur, ein Pr¨ateritum und ein selten gebrauchtes Plusquamperfekt. Eine weitere Gemeinsamkeit der meisten slawischen Sprachen ist die Einbeziehung des Merkmals [± belebt] in die Nominalflexion, d. h. in bestimmten F¨allen richtet sich das zu gebrauchende Flexionsmorphem danach, wie dieses Merkmal bei dem betreffenden Nomen oder Adjektiv belegt ist. Im Polnischen betrifft die Unterscheidung den Akkusativ Singular und Plural der Maskulina.

KAPITEL 1. EINLEITUNG

1.3

6

Phonetik und Phonologie

Die Phonetik und die Phonologie sind zwei Teildisziplinen der Sprachwissenschaft, die sich mit Sprachlauten befassen. Sie unterscheiden sich in den Gesichtspunkten, unter denen sie die Sprachlaute betrachten. Die Phonetik besch¨aftigt sich mit den physikalischen Eigenschaften von Sprachlauten (Phonen). Von Interesse sind vor allem die Art und Weise, in der Sprachlaute produziert werden (d. h. der Einsatz der Artikulationsorgane wie Zunge, Lippen und Stimmb¨ander), und die akustischen Eigenschaften der produzierten Sprachlaute, also die Art und Weise, wie der H¨orer die Laute wahrnimmt. Die Phonologie behandelt die Funktion von Sprachlauten in einzelnen Sprachen. Ein klassischer Gesichtspunkt der Phonologie ist die Frage, ob es Beschr¨ankungen f¨ ur die Distribution von Lauten innerhalb der m¨oglichen Wortformen gibt. So ist z. B. festzustellen, dass im (Hoch-)Deutschen der   4 Laut (entspricht dem in ) nur nach den Vokalen   vorkommt. Andererseits kommt der Laut (entspricht dem in ) in allen u brigen Umgebungen vor. ¨ In solchen F¨allen, wenn zwei oder mehr Phone komplement¨are Distributionen aufweisen, werden die entsprechenden Laute Allophone genannnt.5 Wichtig ist hierbei, dass diese Bezeichnung nur jeweils f¨ ur eine bestimmte   Sprache gilt. und sind im Deutschen Allophone, in anderen Sprachen   kann eine Unterscheidung zwischen und bedeutungstragend sein. Es ist also im Deutschennicht n¨ o tig, bei der Repr¨asentation von W¨ortern   und zu unterscheiden, weil die Aussprache zwischen den Allophonen durch die Umgebung festgelegt ist. In der Phonologie abstrahiert man darum von den Lauten (Phonen) der Phonetik und betrachtet die so genannten Phoneme. Phoneme k¨onnen als Gruppierungen von Phonen angesehen werden;6 4

Ich verwende in dieser Arbeit die u ¨bliche Notationskonvention zur Angabe von phonetischen, phonologischen und orthographischen Formen. Phonetische Ausdr¨ ucke stehen in eckigen Klammern (z. B.    ), phonologische zwischen diagonalen Strichen (z. B.   ) und orthographische in Winkelklammern (z. B. ). 5 Es gibt noch eine weitere M¨ oglichkeit, Allophone zu definieren. Nach dieser zweiten Definition sind zwei Phone genau dann Allophone, wenn man in W¨ ortern jeweils das eine gegen das andere ersetzen kann, ohne dass sich die Bedeutung ¨ andert. Zur Bestimmung von Allophonen nach dieser Definition dreht man meist die Definition um und sucht f¨ ur jeweils zwei Phone so genannte Minimalpaare, d. h. Paare von Worten, die sich nur in diesen beiden Phonen unterscheiden; im Deutschen ist z. B.  !#"$% –  &'"(% “ ein Minimalpaar ” f¨ ur die Phone  ) und  & . Alle Phone, f¨ ur die keine Minimalpaare existieren, sind dann gute Kandidaten f¨ ur Allophone. 6 Dabei ist nicht ausgeschlossen, dass ein Phon zu mehreren solchen Gruppierungen geh¨ ort.

KAPITEL 1. EINLEITUNG

7

u ¨ber die Aussprache eines Phonems, d. h. dessen Realisierung als Phon, wird mit Hilfe von Regeln wie der oben skizzierten entschieden. F¨ ur das Deutsche wird z.B. im Allgemeinen ein Phonem /C/7 als Grup  pierung der Phone und angesetzt. W¨orter wie und  werden dann phonologisch als /n C/ bzw. /n Ct/ repr¨asentiert; durch die     Regel tritt nur nach auf“ kann dann entschieden werden, dass     ” die beiden W¨orter und gesprochen werden. Aufbauend auf dem oben beschriebenen Phonembegriff stellt die so genannte generative Phonologie einen Zusammenhang zwischen Phonologie und Phonetik her. Den Kern der generativen Phonologie bildet die Auffassung, dass zu jeder (phonetischen) Wortform eine abstrakte Repr¨asentation (die so genannte zugrunde liegende Form“) existiert, aus der mit Hilfe von Regeln ” die phonetische Wortform ( Oberfl¨achenform“) abgeleitet werden kann. ” Der Hauptnutzen einer solchen zugrunde liegenden Form liegt darin, dass es die Bildung unterschiedlicher Oberfl¨achenformen eines Morphems erkl¨aren      ( kann. Die deutschen W¨ orter   und beinhal   ten die Morpheme und ; aufgrund der identischen Semantik der beiden Morpheme werden sie als zwei Formen desselben zugrunde liegenden   aufgefasst. Analog zum Begriff des Allophons nennt man Morphems solche Morpheme Allomorphe. Durch eine Regel (der so genannten Auslaut   

  verh¨artung) wird dann das im Auslaut der Form in umgewan delt, wenn nicht durch Anh¨angen des Endungsmorphems die Anwendung der Regel unm¨oglich wird. Neben der klassischen generativen Phonologie sind zahlreiche Abwandlungen der generativen Phonologie von verschiedenen Autoren verwendet worden. Die meisten unterscheiden sich von der klassischen generativen Phonologie haupts¨achlich in der Art und Anwendung der Regeln. Zu den Abwandlungen der generativen Phonologie geh¨ort auch die durch Goldsmith ([9]) begr¨ undete autosegmentale Phonologie, die die zugrunde liegende Form auf verschiedenen Schichten, die miteinander in Beziehung stehen, repr¨asentiert. Eine weitere Alternative zur generativen Phonologie ist die relativ neue Optimalit¨atstheorie ([16]). Hier werden Obefl¨achenformen nicht durch Regeln aus zugrunde liegenden Formen abgeleitet, sondern es werden Bedingungen formuliert, die die Oberfl¨achenformen erf¨ ullen sollen. Die Realisierung einer zugrunde liegenden Form ist diejenige Oberfl¨achenform, die die wenigsten (oder die am wenigsten schwerwiegenden) Verst¨oße gegen die Bedingungen aufweist. Die Optimalit¨atstheorie wird z. B. in [11] genauer behandelt. Die generative Phonologie und das Two-Level-Modell, auf das ich mich 7

In der Literatur findet man oft das Symbol " als Bezeichnung f¨ ur dieses Phonem. Ich verwende stattdessen /C/, um den Unterschied zum Phon  "$ zu verdeutlichen.

KAPITEL 1. EINLEITUNG

8

bei der Modellierung der Phonologie des Polnischen beziehe, werden ausf¨ uhrlicher in Kapitel 4 beschrieben. Die verschiedenen phonologischen Formalismen wie die generative Phonologie und das Two-Level-Modell dienten urspr¨ unglich dazu, Beziehungen zwischen zugrunde liegender phonologischer Repr¨asentation und phonetischer Form herzustellen. Eine alternative Anwendung ist es, statt phonetischer Formen orthographische Formen abzuleiten. Dieser Ansatz wird in dieser Arbeit auf das Polnische angewendet. Eine ausf¨ uhrliche Einf¨ uhrung in die Phonologie gibt z. B. Spencer in [20].

Kapitel 2 Die polnische Laut- und Schriftstruktur Die phonologischen Regeln, die ich in Kapitel 6 auff¨ uhren werde, sollen es erm¨oglichen, aus der phonologischen Repr¨asentation eines Wortes die orthographische Form abzuleiten. Zum Verst¨andnis der Regeln w¨are es also nicht unbedingt n¨otig, die Aussprache der W¨orter zu kennen. Die polnische Orthographie weist aber im Bereich der Konsonanten einige Schwierigkeiten auf, wegen denen die phonologische Repr¨asentation nahe an der Phonetik erfolgen ¨ muss.1 Darum gebe ich in diesem Kapitel zun¨achst ein Uberblick u ¨ber die Phonetik des Polnischen. Danach beschreibe ich auf der Ebene der Laute die phonologischen Prozesse, die im Polnischen auftreten. Im dritten Abschnitt des Kapitels folgt eine Beschreibung der polnischen Orthographie.

2.1

Phonetik

In diesem Abschnitt werden zun¨achst nur die artikulatorischen Eigenschaften der polnischen Laute beschrieben. Ich versuche in diesem Abschnitt einen Kompromiss zwischen den sich z. T. widersprechenden Darstellungen der polnischen Phonetik von Biedrzycki in [3] und Damerau in [7] zu finden.

2.1.1

Konsonanten

Das Polnische besitzt 43 Konsonanten2 (siehe Tabelle 2.1), von denen sechs allerdings nur in Lehnw¨ortern vorkommen. 1

Abgesehen davon ist davon auszugehen, dass eine an der Phonetik angelehnte phonologische Modellierung kognitiv ad¨ aquater ist. 2 Zum Vergleich: das Deutsche besitzt nach der Darstellung in [4] 26 Konsonantenlaute.

9

KAPITEL 2. DIE POLNISCHE LAUT- UND SCHRIFTSTRUKTUR

      bilabial

Nasal Plosiv Frikativ Affrikate Approximant Lateral Trill

labiodental

 



alveolar

palatoalveolar

   ! )  ( 0 1 1 

*"



alveolopalatal

##

$$

palatal





+-.,

velar



  % % '&

10

labiovelar

/ /,

Tabelle 2.1: Konsonantensystem des Polnischen. Die eingeklammerten Laute kommen nur in Lehnw¨ortern vor. Die rechts in der Spalte stehenden Laute sind stimmlos, die links stehenden stimmhaft. Eine Reihe von Lauten kommt genauso oder ¨a2hnlich auch im43 Deutschen  65  vor. Gleich gesprochen werden der Approximant , die Nasale , die 87:9=