speeding up parsing of biological context-free grammars

16
Speeding up parsing of biological context- free grammars Fredouille, D and Bryant, CH http://dx.doi.org/10.1007/11496656_21 Title Speeding up parsing of biological context-free grammars Authors Fredouille, D and Bryant, CH Type Book Section URL This version is available at: http://usir.salford.ac.uk/1758/ Published Date 2005 USIR is a digital collection of the research output of the University of Salford. Where copyright permits, full text material held in the repository is made freely available online and can be read, downloaded and copied for non-commercial private study or research purposes. Please check the manuscript for any further copyright restrictions. For more information, including our policy and submission procedure, please contact the Repository Team at: [email protected] .

Upload: others

Post on 12-Feb-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Speeding up Parsing of Biological Context-Free Grammars

Speeding up parsing of biological context­free grammarsFredouille, D and Bryant, CH

http://dx.doi.org/10.1007/11496656_21

Title Speeding up parsing of biological context­free grammars

Authors Fredouille, D and Bryant, CH

Type Book Section

URL This version is available at: http://usir.salford.ac.uk/1758/

Published Date 2005

USIR is a digital collection of the research output of the University of Salford. Where copyright permits, full text material held in the repository is made freely available online and can be read, downloaded and copied for non­commercial private study or research purposes. Please check the manuscript for any further copyright restrictions.

For more information, including our policy and submission procedure, pleasecontact the Repository Team at: [email protected].

Page 2: Speeding up Parsing of Biological Context-Free Grammars

�������� �� ����� �

�� � ���� � ���������� ������

������ �������� �� � ����� �� �� �������

��� ������ ���� �� ���� ��� �������� ������������������� ���� ��������������

��� �� �������������� ���� �

��������� ������� ���� ���� ����� �� �� � ���� ������ ��� �� ����� ���� ��� ��������� ��� � ��� �� ���� ��� ����� �� �� � ���� ��� ����������� ��� ��� ��! �� �� ��� � ���� ��� �������� �������� ����� � ���� ��� ������ ��� ��� �� ��� ����� "� ���� �� ��� ������ ��������!�#���� ��������� � ��#$��� �� #��� ����� �� ����� �����% ��������� �� ��� ��� ����� ���� ������� ����� �� �� � ������ � �� ��#� ��� �� � ���� ��� ���� ��� ������� ��� ��� �� ��� � ���� �� � ���#��� ������� �� � ���� ��� ��������� ��� �� # � �� � �� ������� ����� �������� �� ��� �� ����� ��� ����������� �� ��� ���� ��� ������ �� � ��� ��� �� ��� � ���� �� �������� �� ��������� ��� ����� � � ������� �� ������ ��� &�� ������� ��� ��� ����� '() ��� ����� ��� �� ����� ��� � � �� $������ ������ ���� ��� � ��#$��� �� #�������� ���� '*) �� �� �� � �� �� ���������� � ��� ����� ���� ��� �����# �� �� � � ������� �� '+) ��� ��� ��� ������� ������ �� � ��� �� ����������� ������� ���� �� �� ������ ��� � � � �� ��� ����� �� �� ���� ������ � ������ �������� � ���� �� � ����

� ����������

���� ���� ��� � ��������� ���� � �������� ������ �������� ��������� � ���� ��� � � ���� � � ���!��� � ���� ������� "����� �#� ��� � � �������$��� � �� �������� �� ���������� � ������ ��� �� �������� ��%�������� $��� � � ������������ �� ������ � � �� �������� � ��������� �������� ��&%������ ��������� '������ ����� � ������� ������ ��� ��� �� ����������%������ ��������� "��&������� �������� ��� ��� �� ������� �(�) ��� �����*�������� � � ���� ������ ����� ��+���� ������ ,������� -�. �/�� "�����0������� ,������� -��. �1�� � ��� � �������� �2� � ����� ,��� ,�������-�. �3�� �� ��� ��� � ��� � ��������� ������� �� ������� � ��� ���&��� �� � ������� �� � � +�� � ��� ������ ������� ������ 4 � �� ��

$�� ��� &+��� ��&$� �������� �� � $�� � ��� �������� 5� � �� ��������$� ���� � ����*�&���� �������� -�. ������� ������� � �� ��� ���������

� ,������ ����������� ��� �� ������ � � � ����� �� ������� ��� ����������� �� � �� �� ������������� �� ��� �� �� �� ��� ������ �� ��-� ��� ������� ���������� ����� �����!�#�����

Page 3: Speeding up Parsing of Biological Context-Free Grammars

�� ��� $��� ������� �$� ��� � � � ���� � �� ��$����� � �� � � �� ������ ������� �� ������ $ �� �*����� � �������� ���� "�� � �����&��� �� ����� �������� ������� � ��� �� � ��$��� ��� �� ������ ��������� �������� ��������4 � � %������� � �������� ��%������ �� ���������� ������ �������� �������� ��� �������� ��� �����*�

6�� ����������� �*��������� ��� �� ����� � �� � �� � � �������� � �����&������ � � � ������� ������� � �������� ��� ��� ������ ������ � � ������� ������� � �������� ��������4 � � ���� � ���� � ��� �� � ���� �&����� � ���� ��� �����%����� � � � ����� ������� 7 �� ������� ������� � ������� �� �� � ���������� -�� �������� ��������� ����. �� ����������� ��������� ������� �� ��������� 6�� ��������� ���4 -�. � � � ��� ������ -��.�������� � �����+���� � ������ �� ����� � ������� ���� �� ��� &+��� ��&$� ������ -�����.� -#. �������� ������� ���������� �� ���� �� � ��� ��������� ������� �� -(.� $ �� ����� ������� �� ������� �� ����� � � ��� ���� ����� �� � �� ��������� � ��� � ��� ��� �������� ��������� �� ������� ������

����� ���������� � � �+������ -"����� #.� $� ������� � � �����*��� �� � ����� �� � � �� $�� ������� � ���� -"������ ( �� /.� 7 �� �������� ��� �� ����������� ������ � �������� ��� -"����� 1.� 7 � ������* �������� � ���� -� �������� ��� � � � ���� �� � ����� �����������. �� � ���������� � � � ������

� � ������

������ ������ �� �� ���� �� ��� +���� ��� �� $� ���� �� ������ ���������� �� �� �� ��� ���� ���� ����� � � ��� � ��� ��%������ ��� �������������� 8 � ��� ������ � �� �� ������� � �� �� ����� � ���� �� ��7 � ����� � � $� � �� ���� �� ���� � � $� � ����� 8 � ����� ���� ������ �� �� ��� ��� � $�� �� � -����� ��� ������ � ��. �� ����� � ������� �� �� 9�������� ��� �� ���������� �� ����� ������� ����� ��������� 7 ��������� $� ������ �� � �� ����� ��� ���� �������

������� �� � ����*�&���� ,������ ��� �� � ����� � : �� �� � ��������� � �� � ��� ���� ���� �� ������� ����� ����������� ��������� �� ��&���������� � �� � ��� ������� �� ����� ��� �� ������ �� : � � � ��� � �������� ����� ��� ����� ����� �� � �� ��� ��� �� ������� ����� ��� ���� � � �� �� ��� ���� � � � ����� � � � �� ����� ��� ���� ���� �� �������! �� � � �� �

� � ���������� � �������� �� � ����� � � ������� � �+�� ��4

��� � � � 4 �� � � � -�� �. � �� ���� �� � �� � : ������ � : �����

;� ���� �� �� � � �������� � ������ � �) �� ��� �� � �� ��� � ������ ����� 7 � �������� -�. �������� �� � ���������� � �� � � ��� � $�� �� ���� � ��� � � ����� -�. � �� � � � 4 � �� ��� 7 � �������� ���������� ��

� ����� ������� � ��� $�� �� ������� �������� ������ ���

Page 4: Speeding up Parsing of Biological Context-Free Grammars

� ������� � : �� �� � ���� �� -�. � -�.����� ������ �� �������� ��� �� � ���������� � ��� � �� -�. : � �� ��+*� ����� �� �� � �� � ������� ��� �� � ���������� � ��� � �� -�. : �� �� � 4 � � ��� � ���� '������ � �� �� ��� �������� ��� � � ����� �� ���������� � � � ������ ���� � � ���� �� : ��� � �� ��� �����

,��� ��� �� ���������� ����� �<����� ���� � ������� ������ 7 �+��� ��� ����� $� ��� � � ���$��� ������4 � � ����� ���������� � �������� ����� -����� �� : �� � �� �� : �. �� � �� � ���������� $�� ������� � � 4 � � � �� ;� ���� � � ���$��� �������� ��� ��������������4 � �������������� ��� �� $�� ����� ��� � ���� � �� ��� �� � � ����������������� �� $�� ����� ��� � ���� � � ���� ;� ���� � � ���$��� ������ ������������������ $�� ���� � �� �� +*�� �� ����� �� : ��� �4 � � ����������������� $�� ����� ��������� � � �� ��

���� ����� � ��

� � � �� � � ���

�� � � "������� ��� ��������� $�� ����� ��������� � � �� ������ ���

��� �

� � 4 � � �8� ����� 7 � ������ �� %������� ���� ��� � ����� ������� � ���������� ��� ���� � ��������� � � ���� � ������ � � %������� ������ � ���&��� �� ������� � ��� 5� ��� �� � ���� � �� � ��� �������������� ������� � ���� �+������� ����4 -��. : -��. : � � �� -��������. : -��������. : �� �� � 4 � � ��� � ���� ;� ���� �� ���� � � ��� � ����������� $� ��� � �����&���� ����� ��������� � ���� ��� ���� ���������� ��������� �

����� �

���� 4 �� ���

�� � �� � � ��������� �������� 5� � � �������� � � �� ����� $� ������ � ��4 � �������� : �� �� � ���� �� �� ��� $�� : � � ) � �� �$�� ���� ������� �� �� �� ���� $�� �� � $�� � ����� � � $� � ����� �� � � �������) � �� ������������ �� �� ���� $�� �� �� � �� �$�� ���� ������� �� �� ����������� ��������

�� � $� �� ���4�� -$�� �� � � �8� ����� � � �. ����� � � ���$� �� �������� �� ������ � �� ����� �� ������ � �*���� -���� �����84�� :�� �����#4/� : ��� ������4�� : �.� ����� ���4� �� ��4�� ��� �������� ��� � �������� ���4�=��� ���4���� �� ��84���

� ������ ���� ���� � �������� �������� ������

5� � �� ������ $� ������ � � ���� � � � ��� &+��� ��&$� ������ -�����.$�� ������� � ����� "�������� (�� �������� � � ��������� � � � ������ � ����� "��������� (�# �� (�( $� ���� �������� ��� � � �<��� � � � �������������� ��� ����� � � � ����� �� � $�� � ������� �� �� $ �� �*��� ����������� � ������� � $ �� ����� ��������� �����

��� ��� ���������� ������� ������

7 � ����� ��� ����� $�� �� ��� � $ �� �� �� ����&������� �� ���� ��� � �� �� � � 4 �-� � � �� ��.� 5�� $��� �����*��� �� �� ��������-�-������..� $ ��� ��� �� � � ��� � � � ����� � ��� ����� �� �� �$� ��� � ��

Page 5: Speeding up Parsing of Biological Context-Free Grammars

������� � ���� &+��� ��&$� ������� � � ������� ���� �� �����-���. $�� ����� �������� ��� � �� ���

(� ���� � �����'�� �)*� �� � . � ����� �� � . � ���� �������� ���% /�� ����� �����+� ���� �� �012 � � ������ � ��� �012� �� �� � � � �����'���� ���0(�2)�3� ���� �� �012 � � ������� � �. � ��� �012 . �012 ���� �����'�0(�2� �0(�2)�

������ �������� � � � ������� � ����� ��� ���� � ���������� � ��� ����-�������. ������ �� �� ������� � �� ���� �� ��� �������� �� ���������

7 � ����� ���� � �� ������� � �*���� � � ����� � ��� ������� ��� ������ � �� ����� � +� �� �%��� � � � ����� $� �� 7 �� ����� �� �*���� ��� ��� &+��� ������� �� �� ����� �� �� �� �� �������������� ���$��� � ������ $� �� � � ��� ���� ��������� ������� �� ���� 5� ��� �� ��������� � ������+� ������ �� ������ � �� 7 � $� � �� ������� �� ������ � ��< ����� �������� �� ���� ����� �*�������

��� �� ��� ��! �" ����� ��� ���� �#��$

7 � $��� ���� �*������ ���� �� � � ����� �� $ �� � � $ �� ����� � ��� �&���� �� � �� �*���� �� ��� � ��!��� � $�� �� $� ���� � ����� $������� � �� $��� ���� ������� ��� � � �������� � � ����

��������� �������� ����� � � ����� �� �� $�� � ����&������� � ������������� � �� � � ��� �&������� � ��� ������������� �� � �� ���� >������� � $� � �� � � ����� �� � ��������� ������ �� � ��� �� � �� �����

#������� $� �� � ���� �����-�����.� $�� �������� �: �� � � ������ � ������� ������ ����� �� ������ �� ����

��������� ������ ����� ��� >������ # $� ��� �*���� � � %������� ��&����������� � �� ��� ��� ������ � �� � � ������ ���

#������� %� �� � ���� �����-����������. -����� �����-����������..� $�� ��� ���� � � ������ � ������� � ����� ����� �� ������ �� � �� �� �������� -�����%�������. �� �� : ��� ��

������� ����� � �� �: � �� ��� � ��� �������� ��� �� >������ � �� #������� � � $��� ���� �����*��� �� ���� � �� ������ � � ����� $� � � ����!�����

��� ������ ��� �������

;� � � ���� �� � � ��� ��� ��������� $ �� ����� ��� ��%���� � ������������� $ �� ����� � � ������ 5� � �� ���������� $� ������ � � ���� � ��&���������� �� ������ � ���� � � � ������ ��� ����� � ��� ������ 7 ������ �������� ������� �� � ������ ���� ( � ������ � � � ����� � ���&���� ��������� � ��� ����� �� � $� �� ������ � #� >������ ( � $� � �� � ����+����� ���� $�� ��� ��� � ���� �� ������ ����� ������ � %�������� �*�������� �� � ��� �� �� �� >������ #�

Page 6: Speeding up Parsing of Biological Context-Free Grammars

������� � 9��� ( � ������ � � $�� ��� �����������

(� ���� �� �012 � � ����

*� �� �012 � � �� ���� �� �012 � � � �� ���� ��� �� �� �� �� �� �����+� ���� ��� ��� 1 �� ���3� � � ��� � � 0���� �'�� ��)2 � �����'�0��2� �0(�2)4� ���� � � ��� �012� �� �� � � � �����'���� ���0(�2)

#������� &� ;� ���� �� ������ ������ � � $�� ��+����� � ������ �#� �� �� � � ��� ���������� $�� ���� � �� �� -$�� � : 8 �� �� :��� � � ��� �� ��������.� 7 � ���� ������-����.� $�� � � � �� ����� � �� �: ���������� � ������ � ������� � ����� ������ �� �� -���� ��.� ��

� ������ ���� ���� ���� ������

;� ���� �� � �� ������ � � �� � ��� � � � � ��� ������ -��. $ �� �� �����&���� ����� "�������� /�� �������� � � ��� "�������� /�# �*������ � � �<��� �� � ��� ������������� � �� �� "�������� /�( �� ��� � $�� � ������� ���� $ �� �� �� �� �� $�� �*��� ��������� � $ �� ����� ��������� �����

%�� �����������

7 � �� ��� ����� ��� � -��� � ������� ��� ������ � ������� � �.�5�� $��� �����*��� �� ��������� �-����.� �� �� �� � � � ������ � �����&������� ��� � � ��������� � $��� � ������� � ��%����� -���������� �� �*��������������. ��� � ��������� � �������� ��?��

;� $��� �� ����� � � $ �� ������ �� ��� ��� ���� �������� ��� ������� ����������� �� ������ � � � ������ �� � � ��������� ����� ��� �������@� A�� 7 � ����� ������� � � ��� ������� �� � � ����� � �� �� � ��������� � � ���� 4 !� � � �B�� �� "�� �� ���� ����� � �� � � � ���� � ���� !� �� ������ � ���� ��� ��� �������4

��� ���4�� -�.

"����� � �� B ��� ��������� ���$��� �������� ��� � �� �� �� ���$��� ��� � � ����� �� �� ! �� ����� � � ���� ���� � � � ����� �� ����� � �� ������ � ���� ������� � � � ����� 5���� ��� ���� �� � ��� ����� �������� ���C%����� �� � �� ������� �� � � ������� �< ������� ������� �� ���� � � ���� � � � �B8� ����

5� ��� ��� ����� ������������� �� � C����� ��8� ���� � � �� +��� �������-�� �������. ����� $ �� �� �� ������ 8� �� � �� ������� ��� +��� �������$�� ����� ����� �� ������ � -� ����� ���������� ��� � � ���. � 7 � ������ ����� ��������� ����� �� � : ���� 5� � � C����� �������������� ����� ���������� � � ���$��� �%�����4

�"� Æ � � ��� � ��4 � �� "!Æ �� " �� ��4�� -#.

Page 7: Speeding up Parsing of Biological Context-Free Grammars

C%����� # ���������� � � ���� � �� ����� $�� � ���� ���� � �� ����� �� ���� ���� � �� ������ � � � ��� ������� � � ��� � � ���������� � �� �� � ������ �� ��� � �� ����� 7 � ��� ����� $ �� � � C����� ������������� ������� ������� ��� � �� $ �� ������� �� C%������ � �� #�

%�� �� ��� ��! �" ����� ��� ���� &���� �����

;� $��� ������ � � ��� �������������� �� ��������� � ��� �����*��� ������ � ������ � ����� � � �� ����� �� �������� 7 � ��$�� ����� $� ��� � ������ � ��� ������ �� � � ���

#������� '� 9�� � : �� $ �� ��������� ��� �&������� � ���� �� � : ��

$ �� ��������� ����&������� � ���� �� � �8� ����� ��� �� : �# � �8� � 4 �! �� � ��B�� # � �������� ! �: ��� �� �� : ���-���� ���� = ��.� "������ �: �� � � ������ � ����� �� ������� $�� � �� ���� ���� �� ��� �� ��� �������� � ����� �� ��� �� ����&������� � ���� $�� 4 ��� : ��� : 8 �< �� � ���)��� : -� � 1��$# = ���$#. = ���-#1 � ��. = ����$# �� ��� � -#��� = �.������ �-#���� = ���.� �< �� � ����

��� >������ /� �� ��� �&������� � �� ����&������� � ����� ������� ��� ������� ������ -����� ��� �� �

��. � ����� �� � � $��� ���� %������� �� � � ��?� � � �

����� $�� �$� ��� �� ��������� ������ ������������ � � ������ � �������$ ��� � ��� �� ������ �� �� �� ��� �� ������ ����� ������ � ���� D�� ����������� �������� ���� ��� � ������� � �� ��� ���$ ��� �� � � �����$�� �������� � � ��� � �������� ��� ����� � � �������� �� �� � �� ������ : 8� ��������� � ��� ������ � � ���$��� ����*������� ��� �� ���4

��� ������ = ����

� �� ��� � # � % � ��� $ ��� % �� ������ � $��� � �� ��� �&������� � ���� ����� � ������ �� � ��� � � � �� � �� ����&������� � ����

#������� (� �� � �8� ����� ��� ��- � ��. -����� ��- � ��.. �� � � ��� � ����� ��������� � ��� �� ����� ������ �� $�� ��

��� � � -����� �����. �� ����

����� ;� � �4 ���- � ��.� � ���- � ��.�= #��

��� >������ 1� $� ��� ��� � �� $� $��� ��$��� � � ��� ����� �� �������$ �� ����� ������ ������ ���� ������ � %������� ������ ����� � � �<����������� ��������� � � � �� : �� � � ���� � � � ��� �� ����� ����� �������� � ��������� ��� ������ � � �<������ ��� � ������ �� %���� ����� -���-��� � ��.. �������� � �� � � ��� � %������� ���� �� �������� �� � �����������

%�� ������ ��� �������

"�� ��+������ � � � �� � � ������ ���� ����� � ���� �� �� $ ������������� ���������� �����4 ��8� ����� ����������� ����� $�� ����� � � ���� � � �� �� �� �3� �� ���������� �� ��� ����� �� ����E� �*������� ;����� � �� ���� �� �� � � C����� ������������� � ������ � � ������ � � ����$��� $��4 -�. 5���� � � � ��� � � � � �B�� � $�� � � ���� ��� ��

Page 8: Speeding up Parsing of Biological Context-Free Grammars

������� �� �������� -�. C�� ���� �� ���� � � � ��� !� ����B�� �� $�� � � ��� ����������� �� ������� ��� �������� $� ���� ! � �� � �B�� � ��� ���� ����� &������ -�. ����� � � ������ � +��� �� ������� $�� ����� ����� �������� #� $� ������ ����� !� �� � �B�� # �< ���� !� �� � �B�� � �� ��������� &����� �� # � � �= �� ��= ��� $ ��� � �� �� ��� � � ���� � � � ���� �8� � �� � � ��� �� ���������

;�� � ��� ��+������� � ��� ���� $�� � � ���� �� ���� ���� �� ��������� �������� ��� ��� ����� ��� ������� �� &������ 7 � ��?� � &����� �� �� � �$��� ���� � � � ��� � �-����. ���� � � $��� ���� �� �� �� "�������� /�#� 5���������� � %������� �� � ��� �� �� ���� ��� �������� � ����� ������ �� $������� ����� �� "�������� /�#� � � ������ � ������ $ ��� � ��� ��� ������ �� �� ����� �� �� ����+���� ��� -����� � � ������ � ������� # �� ����� �� � ��� !� � ���B�� # �� �����.�

� ��� �� ���� ��������

7 � �������� � � � �*��������� �� � ������� �� ���������������� ���� ����������������������������������������������� F������ ����� � � ���������� � � "������ #188 -���� "��6" 1�@.�

'�� $���� ������ �� ��� �� ��(��&��

����� 7 � +��� �*���������� �������� ���� �������� � � � �������� ��������(� �� � ����� � ��������� �� � � �������� ������� ��#� �� ����� � ��&%������� ;� � �� � � ������� -����� �������. ������� ������� �� �������� � ������� �������� � �� ������ ������ �������� -����� ������ ��%������.�� � � $��� ������� �������� ��� �� ���� �� �������� $�� �$ �*��������$��� -7 �� ��������� � ������ � ������� ���������.� 7 ��� $�� ��� �� � ������������� �������� � $� � �� � �� ��� �� ������� �� ���������� �����&���� �������� � ��� �����* �������� ��������� 7 ��� � ��� ������ ��������� � �����%������ � � � ������ ������� � ��� �����* ���������) ���� ���� ������ �� ��� �� � � ���� ������ � 188 ������� ���&������ $� ������ �888 ��%������ ��� �������� �� ����� � ��� ��%������$�� � ������� �%�� ����� � � � �������� �� ��� �������&��%����� ������� � ������� ���� �� ���� �����*������� 7���� � �� �� � � ���� ������� ����� �� �������&��%����� ������ $�� � � �<����� ������� �� ���� �������������� � ���������� � ��� �*������ �������� �� �������� �� � � � �������� ��� � � � ��� �� � � ���� ������ 7 ������ ��� ����� �� � � /AA �������� �������� �� � � �888 ��%������ ������� ��� �������� ������ � �������� � ��� ������� ���� ������ �� � ������� � � ������ � � � ����� $��

��������� �� ������� ������ � � � �������� � � �� $�� ����&������� ����� �� � � ����� $�� ��� �&������� � ���� � � ������� ������� ������ ��

� ����������������������������� ������������������ ���������

Page 9: Speeding up Parsing of Biological Context-Free Grammars

�! �� ���� 5��� /����� ��������

����� � � � �� �� �� �� ���� � ��

�� ��� �� 3 +6�� 7( 3�� +* 1��

�� ��� �� 3 +8�� 7( 3�� (8 3��

�� � � � �� ( 43�� 8* 3�� ( *1��

�� ��� �� ( 77� 3 7*� +* 1��

�� ��� �� ( 77� 3 7(� (8 4��

����� ��� �� 3 +4�� 7+ 1�� � 78 3��

����� ��� �� 3 +(�� 7* 3�� 4+ *��

����� � � � �� 1 8+�� 39 7�� 1 +41��

����� �� 5��� �!���� ��� ��� �� �������� ��399 �� �� ������� ����� ��� ��� ����� ������:;&,11+43�

�78 3� . *3� � 81�� �81��(111 ���������

��� �� :��� �� � �� �� � ����� �� �� �������� ������� ���� � �� � ��� ���� ��� ��� �� ��� ��������� � �� ������ �(11 ����� ��� ����� �� ��� !#�! �� &��� � �������� ��� ������ �� �� ��� ���� ���� ����� �� -�� ��� ��� � �������� � ��� ������������ ������� ������� ���� 4111 ���� ������ ������� ���� ���� *1 ��������� ������� ����� ��� ���� ����� ��� ������� �� ��� �� � �� �� �� � ���� ������ �� �� ��� ������ ���� �� � ���

� � ��� � � �������� ��� ������������� �� � ����� �<��� � ������� �������+����� � � ����������� � "����� /�( � ��� ����&������� � ����� �� �� �������� �������� ���� ����� � � ���� ������ �� ����� � � ��+������������� �� "����� (�( �� /�( -������� �� � � ������� �� � ����� ������ � ��2 �� � � ����� �� # �� � � ��.�

�� ��� ��� �� � � � ��������� � � �*��������� �� � $ ��� �����+���� ��<������ ���$��� � � ������ �� � � %������� ��� ��������������� 7 � �*���&��� �� � � ������� :;&,11+434 �������� !"#$%&'"()'"*+,-&'"*+,()$.',�"/01'"()/%$.12'� 7 �� ������� �������� � ������ ��� $�� ����� �81� ���$� ����������� � � ���� �� ��� ������� 7 � �<������� ���$��� � �� ������� ��� �� ������� �������� ��� � � ������ � � � ��� -�� � � ��������� � � � ���&����. �� ��� ����� ������ 7 �� �� � �� �������� ������ � � � ������� ����������� � � � ������ ��� �������������� 7 � ����� $�� ������ ��� �� �� ����� � � �� ������� ����� #/ ���� � $��� � � �*�������� ��$&��������� �� "����� (�#� �� � ����%������ ���� ������� ����� � � �� �������

Page 10: Speeding up Parsing of Biological Context-Free Grammars

� � ���� �������� ��� � � /AA ��������� �� � � ���� ����� � 7���� �� ���� �� ����� $� ��� � ��� �� ������� �� "������ (�# �� /�#� ����� � � %���������� ������������� ���� � ������ ������� ����� �� ��� �������� ������ � � ����� �� � � ������� �� ������� $�� ��� �������

'�� $���� �+� �� ��� �� ��(��&��

7 �� ��������� ������� ������� ����� �� �'� ��������� 7 ��� ����������������� ��� �������� ������� � �� � �� � ������������� ��<����� ��������� �*��� � ��������� �������� �� �'� � F'� ��&%������� � � �� ����� �� � ��� � �2� �� ���� $���� ��� �� � � �'�GF'������� ��������� � �������� � ��� �������� ��� �� ��� � � � ��������� ��(� $ �� �� �� �������� ������� ����������� (H �� 1H ������ � ��&������� �F'��� 7 �� ������� �� ��� � � ������ �� ������ �� �<�����������4 -�. �� �� �� � � � ���� ������ $ ��� � �������� � �������� ��� ������ -#. � � �� ����� � ������� �� � � �������� �� �� ���� � � $�� ������� �������� �� ���� � � ��� ���� � � � �������� �� -(. � � �������� ������������ �� ��������� $�� �� � ��� ������ ��� ����*�&���� ���������7 � ����� ��%������ � � ���� ����� ��� ������� � � ��%����� ������� �I7F� �������� $�� ��������) ���� ���� ������ � ��� � �������� � ������� $��� ��������� ��� �� �� 7 ��� $� ������ ������ 1888 ��%������ ��� � ������ ��������������� $� ����� � � 1888 ��%������ �� ��� � ����� � �� ������� $ �� � � ��������� �*������ ���� � ������� ��������4 ����� �������� �����$�� %������� ������ ����� �� �������� �� $�� ����&������� � ���� �� $�� ��� �� ������ � %������� ������ �����*������� C*������ ����� �� � � �<����� ������ �� ��� �� �� �� 7���� #�

7 � ����� � � �� ����� �� �� ���� �������� ����� ������� ��� � ��#/ � ����� � � 1888 ��%������� � ������� �*�������� � � �� �� � �� � ��� $���� �*�������� ��$&�� �� � �� ������ �� � �������� � � ��� � �������� � ��$��� �� ������� �� ������� ���� 7 �� � $� � �� � � ����� �� �� ��%����� ����� �����* �������� �������� -� �� �� � � ������� � "�������� 1�� ������� �������� $��� ��� �.�

7 � ������� ����� � � � ����� $�� � �� ��$�� � �� � � �� ����� ��

�� �������� ����� � ������ �*�������� �� ���� � � � ������ � � �*�������� ���� # � ������ � #� � ��$&�� ������� � � �� �*�������� �� � � ���������?�� �� � � ��������� ����������� �� ���� # ��� �� ���� ����� � �� ���� ������

� ����������3���������������4)5(����� ����������������������������6�������7��������897����:��� �� �!��� �������� �� ��� ��� ��� ��� � ��� ������ �� �� ����� ��� �� $� ��� ������� �� ���� � � �� ����� ���� ������� ���� ���� ���� �� ���������� "� ���������� ���� ������� ���� ���� <��� � � ��=� ��� �!�� �� � ��� ������ ��� >���� ������ �� �� ���� � ��� ��������� ����� �� �� � ��� ���� ���� ��� �� � �������#������� ��� ����� � � �� ���� �������

� ?������ ���� �� ��� ��������� � ��� ������� ��� ���� ����� '���� ��� ���� �������� � �� )� �� ���� ��� ���� ��������� �� ������ ������ ���� (11�

Page 11: Speeding up Parsing of Biological Context-Free Grammars

�! �� ���� 5��� /���������� � � � �� �� �� ��

�� ��� �� 31 +�� 3*+��

�� ��� �� 31 6�� 3*9��

�� � � � �� *6 7�� +*(��

����� ��� ��� 7+*� * 8+�

����� � � � �� � 931� * 73�

����� �� 5��� �!���� �� � ��� �� ��#������ �� ��� *1 ������� �� �����

@�� �! �� ����� � �� ��� � ������� 3 �!#���� ��� ���� ��� � ����� ���� �� *3������

��$ ����&�� $ ��� ������� �� ����� � ��������� ��������� � � -������*��������. � �� � �������

7 � ��� � � � � �� ��� � $� � ��� ������ �� � ���4 � �� �� �� ����$�� � �� � � ����� �� ������ ��������� �� ����� ��� �������� �� �����*���� ;� ��� ��� � �� � � ����������� $� �� � � � �� ��� �� ������ ������ �� ���� �� � ������� ������� $��� ������ ��� ������

� ��������

;� � � ����� �$ ����*�&���� ������� ������� ������ ��� ;� � � � $�� �� �� �� � � ������� �� ������� ������ � �������� � � �� �� ������ $�� ������� � �*���������� ��� � �� � � ������ 5���� � �� �� � � ����� ��� ������ ������ � �� � � � ��� ������ � ������ �������� ��������� ��� �����*������������ ���������� $ �� �� �� $�� ��� �����* ���������

�� ������ �� �� �����?� � ������ ����� �� �� � �������� ���� ������*���� �� �� ��������� ���� ������ � �� ����� ������������ ���� � �� �� ��������� � ��� ��� �� � ����� ��������� ������� ������ 6� � � � �� ��� $ �� ������� ������ �� ��� �� ����������� �� ����������� ����&����� �� �� �� �4 ���$��� � ����� � �

� � 2 ������� � �� � � ������������� �� �� ����

! � � �

(� ,����-�� A�� ����� ����� ��� ��� ���� � �� �� ��������� B�� ������ �� B����#��� �� ������ � '(948)

*� /������ ;�?�� ��� � ��� �� �� �� ;A�� ���� ��� /� ��� �� �� '(99*) 469C49(+� @������� D� �� ����� ����� :���� � ��� ���-� A���� � �� �������� �� '*11*)

*+4C*+73� :��� ��� @�� "������ ;�E�;�� ;�$� �� ������ �������� ��� �������� ������ � # �

������ �� ��� ������ �� �� � ��� �� ��� � �� �������� ����� � �� ������-����� $� �� B����� ����� �� '(971) *+(C*67

4� /������ ;�?�� /�� �� ��� ���� �������� � ��� � ������� ������ �� ��� ��� � ���� ����������� �� ;A�� F������ �� ��� � :������� �� �� '(99+)

8� ;���G�� 5�� D������ A�� &������-� ��� /����� �� ��� ������� � ����� � ��������� � ���� �� �� '(996) 396C397

6� D����� /���� 5��� ��� ,�� ���������� ;�� ?�� � ��� ������� �� ;A�#,����:����� ��� �������� ������ �� �� ������ �� � ��� ������� ;A� ����������? � ������� �� �� '*11() **8C*+8

Page 12: Speeding up Parsing of Biological Context-Free Grammars

7� ����� ;�� F������ ,�F�� :��� �� ����� ���� C � ���� ��� �� �� ��� � E������,� �������� ������ '(991)

9� �G��� �� 5��� ��� ,�� A������ D������� :������ �� � :������ � ��� "�����'(979)

(1� �����-� F�� E��� ���� ��A�� :���� ��� ������ ��� ��� ��� ,�� ���� F������ ��'*11*)

((� F��� ��� �� �� ��� �����!�#���� ��� �� ����� ���� ,������ �,5 �� '(961)93C(1*

(*� � �� ���� �� �� ����� ����� �� :���� ��� �� ������ ���� � -������������ A������ � ���� �� '*113) ;((4C((9

(+� :������ �� D �� � /�� B������� ��������� ��� ��� ����� ���� ������ � �� 4H �� +H����������� ��� ��� �� ��-����� � ��A�� ����� � ���� �� �� '(999) +67

����!� �! ���� �� �

$��������� � ��� �#��$

�� ��������� � �� #� $� ���� �� ������-�� �.� � � ������ � ����� ������������ $ �� �*������� � � ���� �����-�� �.�

$������! � 7 � ���� � �����-�����.� $�� � � � � ����� � �� �: �� ��������� ������� � ������� � ����� ����� ������ �� ����

#����� ;� ������ � � ���� � ������-�����.� �� ����� �� �������� 7 ����� ���� ��4 ������-�����.� : �� �= (� 5���4������-�����.� : � = ������-������.� = ������-�� �.�

: � = ������-������.� = �: � = � ='��� ������-�� ����.� = � : �� �= (

7 � ������� ���� $�� � � � ��4 ������-������.� : �� �=#=������-�����.�=������-��� �.�� 5���4������-������.� : � = ������-�������.� = ������-��� �.�

: � = -� ='��� �������-��� ����.�. = ������-��� �.�: � = -� = ������-��� ����.�= �� � � �. = ������-��� �.�: � = -� = � = ������-�����.�= �� � � �. = ������-��� �.�

;� � � ������-��� �.� : � �� � �: � �� ������-��� �.� : �=������-�� �.� :# �� � : �� 7 � ������� ���� ����� ��� ������� � � ���� �����-�� �. $��� �� ���� ������� �� � � � ������ ����� � �� �: � -� � ������ � $��� �� ���������� � � � ������ � ���� #� �������� � �� ��� ������� ����� $��� ���*�����.� 7 ������� $� � � � � ���$��� ������� � �%�����4�������-�����.� : �� �= (������-������.� : �� �= # = ������-�����.�= ������-��� �.�

$ �� ���� �� ������4������-�����.� : �� �= ( ='�������-�� �= # = ������-�� �.�.: �� �= ( = ���-�� �= #. ='�������������-�� �.�: �� �=(= ���-�� �=#.= ���=�=% $ ��� % �� � � ������ � ������� �%��� �� �� �: -���= �.-�� �= (. =%� �

Page 13: Speeding up Parsing of Biological Context-Free Grammars

$������! � 7 � ���� �����-����������. -����� �����-����������..� $�� ��� ��� ��������� � ������ � ������� � ����� ����� ������ �� � �� ��&��������-����� %�������. �� �� : ��� ��

#�����;� +��� ������ � � ����� �����-����������. -����� �����-����������.. �����&���� � ������ ������ � ����� �� ������� � �� �� � �� ����� �����-����

���.-����� �����-����

���..� $ ��� � � %������� -����� ��&��������. �����*����� ���� �� �������� � � � ��� �������������� ��� ������ ���� �������� ���������� �� ��

� ���� ����� � ��

����

���� �����-��������.4;� � �4 ������-���������. : �=�����-��� ����

�. -���������� � � ������ ��

���� ( � ������ � �.� ;� � $ �� ������� � ��4 �����-��� �����. : -�� �=�.�

�=������-��� �����.�� 7 � ���� ���� ��4������-���

����.� : ������-���

��.��

�� � � 8� � � ������� ���� ��4������-���� ����

�.� : � ='��� ������-��� �� ����.�: � = �� � � � = ������-��� �� ����.� : �� �= � = ������-��� ����.���� � � ���� ���� �� � � ������� ����� $� � � �� � 84������-���� ����

�.� : ������-�����.�='�������� �= �

: ������-�����.�= � � -�� �= �.�

;� �$ ������ ���������� � � ��� �� � � ������ �� %������� ��� �����&���������

���� �����-�������.4

;� � � ������-�������.� : � = ������-����

.� -���� ����� � ��

� ���� ( ������� � �.�

;� ������ � � ���� � ������-���� .� �� ����� �� �������� 7 �

���� ���� ��4������-���� .� : ������-�� �.� : � �� � ���� # � ������ � ��

�� �� � 8� � � ������� ���� ��4������-�����

.� : � = ������-�������� .�= ������-�������

.�: � = -� ='��� ������-��� ��

��� .�. = ������-�������

.�: � = -� = ������-��� �����

.�= �� � � �. = ������-������� .�

: � = -� = � = ������-������ .�= �� � � �. = ������-�������

.�: # = �� �= ������-������

.�= ������-������� .�

;� � � ������-������ .� : ������-�������

.� �� � � � ������ ��� � ���� � ������4 ������-�����

.� : #= �� �= #������-������ .�

�� �� �� ������-���� .� � �-���.� $ ��� �-8. : � �� �� � 8� �-�. :

#�-�� �. : #�� ������-���� .� � �-���. �� �� �������� �� ��

���� �����-�������.4

;� � � ������-��������. : � ='�����������-����.��

;� ������ � � ���� � ������-����.� -�� 8. �� ����� �� ��������7 � ���� ���� ��4������-����.� : ������-�� �.� : � �� � ���� # � ������ ��� 7 � ������� ���� �� �� � � 84������-�����.� : � ='��� ������-��� �����.�

Page 14: Speeding up Parsing of Biological Context-Free Grammars

: � = ������-��� �����.�= �� � � � : � = �= ������-������.�= �� � � �: �� �= � = ������-������.���� � � ���� ���� �� � � ������� ����� $� � � �� 84������-�����.� : � ='�����-�� �= �. : � = �-�� �= �.�� � ������4������-����

���.� : � ='�����������-����.� : � ='�����-� = �-�� �= �..

: � = -�� = �. = -�� �= �. � ������ �

$���" �" �������! � ;� ����� �� ������ � � ������ � � $�� ��+������ ������ � #� �� �� � � ��� ���������� $�� ���� � �� �� -$�� � : 8�� �� : � �� � � ��� �� ��������.� 7 � ���� ������-����.� $�� � � � ������� � �� �: � ��������� � ������ � ������� � ����� ������ �� �� -���� ��.� ��

#����� ;� ������ � � ���� � �������-����.�� ��� ���� / � ������ � #�� �� ����� ������� � ����� � � � ��� �������-��� 4�� �.� �� � � � ���� -���� ��.��7 ������4�������-����.� : � ='�� ��������������������

�-��� 4�� �.�������-��� 4�� �. ����� ����� � ��$ ���� -�� ��� ��. �< ��8� : �� � �� $� ������ % � � ������ � � �� �� � 4 �� -���� ��. = ��� $� � �4�������-����.� : � = -�� -���� ��.� �. =%� �

$��������� � ��� �$

; �� � �������� � � ����������� � � � ��� $� $��� �� ���� ����� �� �������$�� � �� ���� ���� ���� �� � �� � � � ��� � � � � �B�� �� 5��� �������� �� $�� �� ������� � ���� �������� ���$��� � � ��� �������������� ���������������� � � � �� �*��� � �� �������� -� � ��� ��!���� �. � ��� �������� � � ���������

�� � � ���� � � �� ������� $� $��� ��� � � ���$��� �������4 7 � ���&�� � $��� ��������� � : �� $ �� ��������� ��� �&������� � ����� � : ��

$ �� ��������� ����&������� � ����� � : ����� �� ������ ������ ���� ��

� : ������� �� %������� ������ ����� �� � �8� ����� ��� �� : �# � �8� � 4

�!� � ���B�� # � �������� ! �: ��� �� �� : ���-���� ����= ��.�5������ ���� �� �� � � ��� � ������� �� ��8 4 =�� $ ��� �� �������� ��� ���

�� ������� � $ ��� � � ����� � � ������ ��� ������ � ��E����� � � ������ ������ �� �� � � +��� � � ��� ������� �� ��8 4 ���= �� : ��

�� � ��� ���������� $� $��� ��� ������ � �� � �� ����.� ����� � � ����� � ���� �� �� ������ �� �������� -��� �������� ��� � ������ � �� ��� ����������.� �� ������ � �� ��� ������ �����*��� � � �����

& � � ��� �� -���� ���� ��� ���� �� ������ � � �� ���� ���� ���� � �� ��� ���� ��� � ��� ���� �� �� ����� 072% �� �� � � � ��� �� �� �� 0(12 � � �� ���� ���� �� ��� ���� � � � �I�� � � ��� ���� �� �� ����� � �����

� @�� � � �� �� �� �� ��� ����� �������� � �����

������� �� �������� � �����

�������

��� � � ���� ���� � �� ��� �� ������ �� ��������� G� ��� J������ ������� ��� � ��#������ ���� �� � � ��� �� ����� �� ����� ��

��� �� ��

����

Page 15: Speeding up Parsing of Biological Context-Free Grammars

$���" �" �������! % 5� � �� ���������� �� � �8� ����� � � ��� � ����� ��������� $�� � �� ���� ���� �� ����� �� ������ ��� ���� ��- . �� ��� �&������� � ���� �� ��- . �� ����&������� � �����

$������! % "����� � �: �� � � ������ � ����� �� ������� $�� � �� ���� ������ ��� �� ��� � ������� � ����� �� ��� �� ����&������� � ���� $�� 4��� : ��� : 8 �< �� � ������ : -� � 1��$# = ���$#. = ���-#1 � ��. = ����$# �� ��� � -#��� = �.������ �-#���� = ���.� �< �� � ����

#����� 9�� � �8� ����� ��� 9���� �� ������� ������� ��� �� ��� ����� $�� ����� ������ �%��� � �� $�� � �� ���� ���� � ���� � �� ��� ������� ��� � ��� ��- . �� ��� �&������� � ���� �� ��- . �� ����&������� � ����� 7 � ��?� ���- . -����� ��- .. ��� �� ������ ���� ��� 9���� �� $� ���� �� ��- . -�������- ..� $�� 4

��- . :

���# = � �� �� �� ( � = � �� �� �� : 8 �� �� �

�� ��- . :

�# � ���� �� �� ��# � ����= � �� � ��

5� �� : ���=�� $� � � ��� ����� ��� : ��� : 8� � ��$��� -�� � ���=�. $� ����� ����� �� �� �� ��� �� ������� ��- . �� ��- . �� ��� ������� 4��� : '�� ��������- . : '�� ������-# = � ��.� �

: -�� 1��$# = ���$#. = ���-#1� ��. = ����$#��� : '�� ��������- . : ������='�� ������-# � ����.! ��� � ������= # � ��� � ������ ! ��� � ���= # � ���� �

,� � �� )������ � �: �! ���*��- . : ��� � ����B � 4 ��� -��.

��� � � ���B ��� 4 � ��� -�#. ��� � ��� �B�� 4 # � ��� # � � ( � -�(.

����- . : ��� � ����B � 4 � ��� - �.

��� � �� ��B#� 4 # � ��� - #. ��� � ��� �B#� 4 # � ��� # ( � - (.

#����� +� ��� �"������ $ �� % �� ���� ����������� ���� �� � ����B�� �������� " � �: �� �� �"������� �� � : " � �� " � �: ��! �� ���� �� �

����B�� � ������� " � �: �� �� �"������� �� � : " �� " � �: ������� ���� ���� ����! ���� ��������� �� ��� ���� �� ��� ����������� ��$

�� ��$! �� � ���� ������� ���������� ��� ���� ��%! ��& �� ��%! ��&� ,�� ������ ���������� ��� ���� ����� �� �� ������ � ��� ������

$���" �" $������! ' ;� ��� � � ���$��� �+������ �� � �� ���������4 �����- � ��. �� � � ��� � ����� $�� ��

��� � � �� ���� ���� � ���� �� �� ����������� ������� �� �������� "��������� ��� ��- � ��. �� � � ��� � ����� $�� ��

���

�� ���� ���� � ���� �� �� ����� ������ ������� �� ��������

$������! ' ���- � ��.� � ���- � ��.�= #��

Page 16: Speeding up Parsing of Biological Context-Free Grammars

#����� 9���� # � $� $ �� ����� ��� ������� �� ��� � � � ��- � ��. ����- � ��. ����� ��� 9���� # �%������� $� ��� ��� � �� � � ���� /�� � �� ����$��� ������ � �� ��� �� � �� ����� /�# �� /�( � �� � � ��?� ��� � $���� �� ���- � ��.� � ���- � ��.�= #��� �

,� � �� -�� ��- � ��. �� ��� ��- � ��. ����� ������� ��� �������� �"�������*��- � ��. # ���

��� � � ����� ����������

B#� 4 # � ��� � � �8� ��=#� �� �'�$� �� � ��B � 4 # � ��� � �#� # = ���� �'�%� �� � � �B � �� 4 # � ��� ��#� # = ���� �'�&�

����- � ��. : ��� � ��� ���B#� 4 # � ��� � � �8� ��= # � �� �: # $ � �: 8�

#����� ��� ��- � ��.! ��� ����� ������ � ���� ������ ���� ����� � ��

�����B#� � ������� " � �: ����� �� �"������� �� # � �� " � : # � = � " 8 �

� � # � = �� �� ���� �"������ $ �� %� -�� �� � �� ���� ���� ���� ���������� �� ���� ���� ��� �� �"������ $ �� % ���� ���� ������� ��� ������ ���� ����� ��� ����� �� ��� '�% �� '�& ������ ����� ��� ��� ��� ����� ������.���� �������� ������ ��� ���� ��� ��- � ��.! ��� ����� ��*

���

��� � � � ���B#� � �������� �: ��

���� �"� Æ � � *

�����������

� ��

� ��#� �� �� "��

���Æ" �� ��8*#�8 � �= � � ��� �: ��

���

�� � �!�!� ���

���� � �!�"�� � � �

*

�����������

� : � #� �� "�!� � "����

�����

"� �� ��8*����� ���*#�8 � � = � # � ��

�� � �!�!� ���

���� � �*

���� : � #!� � � �B�� # � �������8 � � = � # � ��

���� : � ## � ��# � � � � ��= # �