oracle text technical white paper

34

Upload: errr33

Post on 17-Feb-2016

228 views

Category:

Documents


0 download

DESCRIPTION

Oracle Text Technical White Paper

TRANSCRIPT

Page 1: Oracle Text Technical White Paper

��

����������������������������� ���������

�����������

Page 2: Oracle Text Technical White Paper

������������������������ �

����������

���� �������� �������������������������������������������������������������������������������� ����� �������������������������������������������������������������������������������������������� ����������� ������������������������������������������������������������������������������������������� ������ ����� ������������������������������������������������������������������������������������������ ��������� ������������������������������������������������������������������������������������������� ��� ����������������������������������������������������������������������������������������������������� ����� ���� ������������������������������������������������������������������������������������������� ������ ������������������������������������������������������������������������������������������������� ��

����� ��!������� ������������������������������������������������������������������������� ��

���"��"���#�� ! ������ ���� � ������������������������������������������������������ $�%���������"��"������������������������������������������������������������������������� $�

&�� '(������"��"�� ������������������������������������������������������������������ $�

)�*� �"���" �� ������������������������������������������������������������������������������ +,�

(���! ���!����)��"���*�����������-�#�. � ������������������������������� +,�

���������������� ���������������������������������������������������������������������������� ++�)�*����#��������������������������������������������������������������������������������������� +/�

&� �� � �"�)�*������*��������� 0� �� ������������������������������������� +1�

��������)�*� �" ����������������������������������������������������������������������������� +1�

)�*�� �� �� �" ��������������������������������������������������������������������������� +��

2������#������������������������������������������������������������������������������������ +��)����� ���� 0� �� ������������������������������������������������������������������������� +��

����3������� ��� ������������������������������������������������������������������������� +��

4 "�� "� �" �������������������������������������������������������������������������������� +��

&��5�#���������������������������������������������������������������������������������������� +��

�� ##� ���������������������������������������������������������������������������������������� +��

���3������ �������������������������������������������������������������������������� +$�6 ����������������������������������������������������������������������������������������������� /,�

�*�����*���������������������������������������������������������������������������������� /,�-���� ! �� �����*�-����� �" ������������������������������������������������������ /,�7�����*"��(��� ������������������������������������������������������������������������� //�

��!��3���� ���������������������������������������������������������������������������������������� /1�8� �"���������� ������������������������������������������������������������������������������� /��-��� �"�)�*����� ����������� ������������������������������������������������� /��9&����##�� ���������������������������������������������������������������������������������� /��

������ �"�!�����������*��������� ��9&��*���3������������������� /���������8�������������*��������� ��� ������������������������������������������������� /$�

Page 3: Oracle Text Technical White Paper

��������������������������

�������8����������������������������������������������������������������������������������� /$��������� ��� ������������������������������������������������������������������������������������� 1,�

:������#���% 0��*� ���������������������������������������������������������������������������� 1+�)�!��3� ���; ���� 0� �� ������������������������������������������������������������������� 1/�%��� ��<��� ��������+,��=�������/ ������������������������������������������������� 11�-������ �� ������������������������������������������������������������������������������������������ 11��������=��* �" ���������������������������������������������������������������������������������� 11��

Page 4: Oracle Text Technical White Paper

��������������������������

����� ����%� �� �#���

�������������������

���������>�������?�� ��"���*�!���'����� ������������"�>� ��#����!����

������+,�����*��*���*�����#� ����* �����������������������*��*��2����

�*�>�������>���*������0������*�*���3��������*� ������������*��.���>� ��

! ���>���*�������%�.����������������#��!��3�� �"� � �������� �����

*���3���@������������ �"������ ����!�����" ��� ����* �"�5�����*�

������ �">���������A��� ��>�(��������#��� ���>�#�����3��� �">�3 �*�

��3� ��A��� ��>�4�&�B9&����� ��������� �">�����������������������

3 �*�A��� ��>� ������������ ��������������*����� ������� .���������������

���

�����������������*����������������� ����� ����!��3��� ����* �"���!��3��*�

�>�4�&��� ����3�� "�� "� �">���*��� " ����*���3���!��3��������������

��##����3�� #������"��"�����*�������*�����*����������'���5 �"��������"����

3#������������A��� ���

��������������������

������������*���*�>���"�� 0� ��������� �����*����� ��� ������3��������.���

��# *�����������������*�*�������*� ��*��.��������3����4������>�� ��*���

��#���������!��� ����!��������#����� �!��3� �������!������"�������3��� ������

��'� ��*���3���>���.�#�"��>�3������>���#���>��3� �>�!���>���*�

#������ �����������������.������������!�.�� ����� �!��3� ��������!���

������� .�����*����3���"�*� �������'�!!�� ���3��������8����������� �"�

��"�� 0� ���?� �!��3� ���C�����������������3#�������� � �"���� ������

#��������.������.���� �"��������"�C����*���#� � ���*���##���!��3���

������� �!������������! �*���������������

��� ����*��� � 0�*� ��* !!�������"�� 0� �������������������������"����� �>�

#��� ������ �����-�������������"�����������3#�� �����������"��.�����

����������*�����3������������ �!��3� ���*�����!��3�3��������������

)3#�������������3���.��� **���.������� ?��* !! ������! �*���3��� ����

�������A��� �� ���#��� ����

8����5 �"�����������!������"�� 0� ��?������� �!��3� �������.���������"'

��3��������"���4 ��� �����>�������.�������������A� �����* !!���������!�

&������"�� 0� ������������"�������3����!���

�����������*�*��>�������� ��������*��� � 0��

�����*�������

Page 5: Oracle Text Technical White Paper

��������������������������

�������" ���!������ �������*�3���"�3������������.�� �����*������ ��

3 �#����# �������.��*���*���"�� 0� ����� ��3�� #�������"����*���� �����

����3�>���*������3�� #���*�����#3������ ���3�������� ���������*� �����

�����!��!!�� ����� ��"�� �"������!�������#��� ���?� �!��3� ����������

�������"�����!�� ��3 �#����# ��>�3������3#�� ����*���.���* !!�����#��*����

!������� �"��� ���������� �"����*����*��� ���������*�*���D*��.���E�

������ �"����*����<������� ��� ���##��������������������� !���������!�

#������ �">� ��"�� �">��#��� �"���*�3� �� � �"�* !!�����#��*���>�.�� ������

������� ��#����#��!��3�������*���� "��������� ��*�����#3����!��##� �� ������

������>�#����������!��#�� �������������������*�3�*�� �������� "����� �. � �>�

����"�#����*�3�� '#��!��3������. � ���!��������#� ���*��.�����

%��� !� ������#��� .��������*����#�������*��*����"����!����� �����

*��.��������3�����������#����� �!��3� ��>� ����* �"�����*������

���������*�*��F��!������>���*��� �������*����������������� �!����������

�!��������*��.������*�#�����������!����##� �� ���*�����#3�����)��� ���� ��

#�#��>�������5������������##������ �����!��3��!������������

������������

�����������!!��������3#����������������� ��������������� �� ����*�*�� ��

.������������+,"����*��*���*�����#� ����* �����������������!�����������

*��.���>������������� 3 �����������*���.�����*� ��"������* !!��������

������ �"�#��*������

����������#��� *����#�� �� 0�*��� �*����!�����* �����!��������� �����

�##� �� ����C���������'���.� �������� �">��'.�� ����������"�>�*���3���

����� ! �� �����*���� �"��##� �� ���>����������� �">�*���3���� .��� �����*�

���� �����

��������������! ������*������������!��3�* !!�����*���3���!��3�����)�

��##���������"����3.����!�*���3���!��3��� ����* �"�#�#����������� 5�����

& �����!��!! ���&�! ���!��3��>�����*�.�� ���&�!�3 ����!�!��3��>�4�&��

��*�9&���

�����������!!�������.���3�� � �"��������!�!������� �����3��5��'���##�� �"�

��������������*���3���� ������������"��"���D��"� ��>�������>��#�� ��>�

6��3��>����E>�:�#�����>�7�����>����* �������*�� 3#� ! �*�-� ������

���#����!�������+,">���������������#������� ��"������ ����*�.���! ��

!��3�����3.����!�5�������#� ���!����������������

• ����#�� �� �"�D!���� "��������"�#����*���� ��. � �E�

• =�����##� �� ��������� �"����#���������������D!������� "�����������

�����. � �E�

• 2������# 3 0� ���

• ��������*�*�����#3������ ���3����

��������G�������?��!���������������#�. � �� ��

����*�*� �����������+,"����*��*���*�����#� ���

�* ������

Page 6: Oracle Text Technical White Paper

��������������������������

• �*3 � ��� �����*�3���"��. � ��

• )��"���*������ ��

��������#�����!� ��"�� ������������"������.���! � ���������3��*3 � ������>�

����*��������������*��"����#���* "3��� !�����������3���"����*�

��"�� 0� ��?�����������

���������� ���������# �����!�������������#��*����� 5����������##� �� ���

������� �����D������+,"��� ����E>���������'(�� ������� �>���������9����"�>�

�������8����������>���*��������� ����������������#������������?����.�� ��>�

�����������������3���*�������������������"��<����5��

�������������

�� ����� ������5�������3����� �3�!���#������ �"���� ���������������� ��

#�����������.������ *���*������# #�� ���D� "����+E����� ����� ���* �������������

��"�>���*����� *������3���!�����# ������� ��.����������"���

� "����+��)�*� �"����� ������

��� !����

������������������� �*��������.������*�� � ����*��.���>���! �������3�

�����8=�������8=��*����������������*��.������3���"��*���3��������*�

��3��������������������>���*��������*�� ��4�� ������ �#��������������������

���!����� �"�����"������ ����# ���G�

��5��

&��5'

�#�

�������3������������ � ���� ��� ����� ����� )�*� �"�

��" ���

�B��! ���

����3�

��#� ��

%��*� ��

)������

&��5�#�

���)�*����

Page 7: Oracle Text Technical White Paper

������������������������"�

�������������G������.�� �*��*� ������*� �����*��.���� ���������������

����3��D�� ��������# ���������*��#����7(���!��E������(�D���"��

�.H���'��� ���������������������. �����*����#����6(� ��� 0�E��

���������������G������.�� �*��*� ������*��������! �������3���� ��

������ .���!��3����*��.�����������3��� ����

������ �G������.�� �*��*� ���**�����.���!��3����8=��������)������

��� �������

���������G������.�� �*��*� �������#���!����� �B�2��#����*������

�� ��" ������������!��������������������"��� �*��*��

���� �*�������*� ���������5�#� �����*��.������

#$�����

�� " �����>����%���*'% *��%�.����� ��*����"�����!�4�&����*�#�� ����! ������

&������*�3���>����! �*������! ���!��3������ ������������������*�.��

���&� ������ ��������*�!�����'� ������� �����!�3������>�������.��������>������

����3���� ����� �������*�#����������#�� ! ��!��3��������!�������*�* ������

�����.�� ��>���*��������

��������������! �����!��������"����3.����!�! ���!��3��>� ����* �"�#�#����������

� 5�����& �����!��!! ���&�! ���!��3��>�����*�.�� ���&�!�3 ����!�!��3��>�

4�&�>���*�9&���������.��3 �*� ����� �"�������3����������#���!����

! ����� �� ��4�&��!��3������ ������������! �������3� �� �� �!��3� ��>������

������* �"����*� ����#������ �����*���3��>���*� �����*�����������#�� ! ��

#�����!����*���3����

�##� �� ���*�����#����3����������#��������! ����3�*����� ���� ������

����3'.� ��! ���>������! ����#�������*�!��3���� �*'#������������3�! ���� ��

� 3#�����������.���#��"��3������� #�����5��������"�3���>����! ���.� �"�

���! ������� � �"����!��3��*� �#���>���*���������*�.� �"������3���!����

! ������������! ����*���#�������*�.���� ����

)!���A� ��*>�������3�! �������������������*��*�I�������"� 0�J�! �������� ��

������� ���#�����������! ���!��3����� A��������.�� ����>�.��#�����������

���*��*�! ���!��3�����������*��*�! �����

���$!%����

������� ������.H��� �����#��� .���!��� *�� !� �"�������� � �"���� ��D�E�!���

��������� �����# �����>��������� ����� ���.��#��*�! ��*�4�#�����&��5�#�

���"��"��D4�&�E�����9��� .���&��5�#����"��"��D9&�E���� ������

�# ������>������� ���������#������������"�������� ����*�� 3 ����������

��3#��G�������������� ����������������� ����������������.������

Page 8: Oracle Text Technical White Paper

������������������������&�

�"���� �"�����������#��������8����!���������� �� �������*� �����

��� ������9&�������� �"��

�������

��������?��H�.� ������#����������� ����?����#�� ���I���*�J����I�5���J���)��

���� 3#���������!�����%����������#�������"��"�>���������H����#� ���� ���

�� �����#�*��� �"���!���#����3�� ��������������������� �"G�

��������������������� !�"��#������$�

�����*�.���#� � ���������*�>�3 ��������#����� �������#�� �����3.���G�

�%�����������������!�"��#������$&

�����������# ��������3�������#���*�>��� ���������33������*��*�! ��*�.�����

�##� �� ���*�����#��@�����5���!��3���*�!����� ������������*�� 5������*�������

� ���.�����G�

�%���'''��������!�"��#'��$&

�<���������� �5����#����� �"���3���*���#���*���������"�������������

�������� �*��*>����#���������!�����#���*������#�� ��� �����*� �����

�*����)����������>�������#���*�� ���3����������*���������*����#����!���

#��������������3#��>�I5 �5 �"����.���J�� ���3����I5 �5 �"���.���J�.��� ������

3����I5 �5 �"�.���J��

���������!���#���*��3���.���#�� ! �*�.������##� �� �����������3.����3���.��

3#� � ���*�! ��*������#���*���

��������'���%�� �

;�� �����# ����3���.��*�! ��*�!������������� ���.��.��5��� ����5����������

��3#��>��������*�! ���H� �����������>�������������*�I ?�J�� ���.�� �*��*�

���� ����I �J����I ?�J����

Page 9: Oracle Text Technical White Paper

������������������������(�

��%�)�����*��$'$��#)%�$!%��$+�

������������##����3�������"��"��G�

�� ��%���%�)��� �

(���������-������ ���C�����������*����������>� � ��#��� .�����

K���3�� 0�?���3����� �����'������*�!��3�������>����������!���I��� L�J�

����*�3����I��� ��J���*�I��� L�J��

����������#��� �"�C���3�����"��"��>���������6��3��>��������������������!�

�#��� �"����*��� ��������*�������������������3#��>�������*��

I&�������J���*�I&M�����J��������� *���*� *�� ������)!������������

�#��� �"� �*���# ��� ��������>�����.����!���������*��� ���.�� �*��*�

���I&�������J���������3������!��3� ��� ���##� �*���A����� 3�>������

�������!���� ������3�� ���3����I&�������J� ����� �*���

�-�3#���*�%��*� ������ �"�C��������������� ����������"��!���

#������ �"���3#���*����*�� ��6��3�����*���������"��"�������������*��

����.��5���*���� ����� ����3#�����!��3��!������ �*���

,)�$-.+����%�)��� �

��3.�� �����"��"���*�����������#����*�� 3 �*�I���*�J� �������3���������

����������"��"������ !!�����������������A� ��*���*�� *�������� �*��"���#��

�!�����������������������#��� *����#�� ���������!���-� ����>�:�#�����>���*�

7���������������!����� �"���33��*�������������������:�#����������G��

��(�!!�() *+!�����),��-����!�./0�1���2�)����3/ /4�,�����)5#��")*�(��/67

)� �������#��� .�����.� �*�3�� '� �"������������##� �� �������������� 3�>����

�##� �� �������5��!������<��N��<6���� ���3������ �.�����*�� *���� ���

����� ��"� �"���.�����*�!����#� �"����5�����*�������!����� �"�:� ���*��

�� ##�����������3� �������#���

8��9����!������ �������7!������2����"���2����"�����"�:!���+!�����2����"���.672����#�;*73��<*�2������7��2����2)���=>�=��� ��2)��33��?3@��?��!*���(�<��������5�*<����!������*�(��+�-.*��#<�#�+�;<�*�.ABA66C�;*:A�*���������������2)���=>�=�:/�3�D���?���9���2�/A7����:��"�+�(�!<��E<��F.�;*67�;*:A�*���������������2)��33��?3@:/������/A7����:��"�+�(�!<��E<��F.�;*67G�*���-.*��#<�#�+�;<�*�.A01A66C�;*:A�*���������������2)���=>�=�:/0�1���2�/A7����:��"�+�(�!<��E<��F.�;*67�;*:A�*���������������2)��33��?3@:/0�1��/A7����:��"�+�(�!<��E<��F.�;*67

Page 10: Oracle Text Technical White Paper

������������������������/0�

G�*���-.*��#<�#�+�;<�*�.AH?A66C�;*:A�*���������������2)���=>�=�:/H?3���/A7����:��"�+�(�!<��E<��F.�;*67�;*:A�*���������������2)��33��?3@:/H?3��/A7����:��"�+�(�!<��E<��F.�;*67G�;*:A��*�!����*� �!���.�6-��"��",*�) �!A7�;*I:A$����!�������.��(� /AI��F$�� IA/ �6�JA7�;*I:A�� ���F�!���.�6 ��!A7����:��"�+�(�!<��E<��F.�;*67$��*�.����+��(�.66C�������������<#�������<*��� ,�����������!����<*��G����+!*���.67��"�+!*���.678

�%1�$%���%�$%��

���� �*� �"���" ������������� �����*� �*�����3�#���5���������

*���3����������� ����3���)��� ��#����>����������������C� !��#�� ! �*�C���

��#� �������������������#�� !���������*����#���*�������#��3���!��3����

�� �*����

����! ������#���!����# #�� ��� �����I �����*� �*�J����� �� ����� ���!����

���*��!��3����*���3��>�� ����������*���� �"���� ���!�*���3���� ���� ��� �

�##�������)� �������*� �����*�.������� � ����� ��������!�������3��������!�

���5 �"����>��� ��� ����� ���!�*���3���������������*���3������� ������ ��

�!����*���

.�2�#�����#��2��2��3����������������������.������

������+,"�#��� *���������� . � ��!��3����5�������.����*�����#������

���*����*����#�����*�����*�.�����*��.����5������������������������ ��

!��3����5���!����� ��"��������� �*����� ��������*��*��������A�����

��" ������� ��3����������������G�

• ��� �"�����#�� ����!�������*���D����*��������*E� ����*��!������

�� �� ���������3� �� �>�.��5�#>�������

• )�*���� �������3����#�� �������� �� ��������!! � ���#������ �"��!�

����*�3 �*�A��� ����

• ��� �"���� )�!���*�����# �"��##� �� �����

• )��"�� ���� �������������2������ �����" �����*�A�����#����

�# 3 0����

Page 11: Oracle Text Technical White Paper

������������������������//�

����-���(���*��# 3 0���3���.���.���������������!��������� ���#���>�

.���*����������' 3��#��#�� ����!����A�����������>������������!!�������

* � ���3���*�����������������#��* �����"� ���������3�G�

• �������� . � ��!��3����5���������#������� �*�����������

���������*�# #�� ���=�%)�?���� �!� �"����#��* ���������5�������

• �������� . � ��!��3����5���������������A��� ���I*�����������

� ��� ��=�%)���� �!�����#��* ���JF�

�����33�� 0�>�����*����"����!� ��"�� ��������##����G�

• ����-���

���������� ��#����!����������+,"�����#� �����*����*��*��* �����

���������������#�����#��*������.������ ��"�����

• 4 "�� ��!��3�����

����*��.����� �������������!�����#������������A��� ������ �������

.�������*������������������

• 4 "��)��"� ��

� ������ ������*� �����*��.���� � ���� ��������� ��"� ��.���! ��C�

!�����3#��>������#*��������*��.��������.����!����*��������

�������!��� ���� �>��� ���3���������������"����� ��"���*>���� � ��

� ����!������� ��*����

• ������3#�� ��

��� ������*�H���� 5���������*�*�����)� ���������*�����#���*�

��"��������������##� �� ����� ��� � �"�����3����

• ��#�� ���&���"��. � ��

��������������.��3���"�*�!��3����*��*�����#� ���3���"�3���

����>�������" �"���33�������� ��.����*3 � ������?��5 ������

• ����� ��

����������������"����������� ��!��������!����*��.�����

������������#��������

)��� ����� ������*���� .�� ��*�� �����3� ��!��������!��������������

Page 12: Oracle Text Technical White Paper

������������������������/ �

�%1���+*� �

����������#��� *���������#����!� �*�����������������������������*�G�

���*��*>������">���*������ ! �� �������.���+��������������� ����!���������

�*���#����

• ���*��*� �*���#��!�����* �����!���'����� ����������*���3����

��*���.�#�"���������!����(�� �*���#��#��� *������ �������!���

���������#�. � ���!���! �* �"�����������������*>�� ��������� �"�

#�"����!��#�� ������������

• -����"� �*���#��C����! ����� �*��*�� "��*��#�� ! ������!���

�(�� ����������"��������!�(!��������"� �*���#��#��� *���!�� .���

������ �"���*���� �"�����.'�#��*��

• -���� ! �� ��� �*���#��!���.� �* �"������ ! �� ��������� �"�

�##� �� ����������!�(�<*�� �*���#�� �������*�������.����!�A��� ��>�

���������A��� ���*�! ����������� ! �� ��������� �"��� �� ���

���������� �� ���������� ��������������

9?����� 8���� �� �*����.� �*�������� �����

�##� �� ������������������� ����!����"��

��������*���3�����O������� �*��*���3����

�!�* !!�����!��3�����������&��%��*>�4�&�>�

9&�>����#�� ������% ��������� �*�>�����

��������3 0������� �*�� ������� ����!�������

9?�����2

9��9�� 8���� �� �*���#���� �*���3������

!��"3������������ �3���3��>�#� ������*�

*���� # ���������������*������������3�����

% ��� �� �*�>�A�����#��!��3����� �� 3#����*�

!���3 �*�A��� ����

9��2��39

9��3>�� 8�����9��3>��� �*����.� �*���*���3���

����� ! �� ����##� �� ��������9��3>��� �*��

����� �*�������*�������.����!�A��� ��>�������

�����A���������������� ! �� ������ �"���

*���3����D#�� ���>�4�&�>����9&�E�����.��

����� ! �*��� �"�������9�2��#�������

���9�2

��.���+��)�*����#������� ���

���������������#��� *�����.�� �"���*�#��! � �*��������.�� �"� �*� �"�

3#������#��!��3�����!�����!'������*����*��.��'������*�� �*���*�A��� ����

��! � �*� �"� 3#������#��!��3�����!���� "��������*�� �*���*�A��� ����

�����������!!���� �*���#���!�����* �����!���'

����� ����>��(�� ����������"�>���*�

����� ! �� �����*���� �"��##� �� ������

Page 13: Oracle Text Technical White Paper

������������������������/��

,�$%�$%$%���%1�� ��%1��+%�4�!%$5�$!%�

)��+,"������������#�� !���� �*������ ������ �*���#*���#��!������G�

3�������>������33 >������"����� ����������8���������������#�� !���������� �����

�� �*�>�������*���3���������������.��� 33�* ������!���.� �"� �����*����

�#*��*��<��������������"� �*���#��C�*�� "��*��#�� ! ������!�����������

# ������!����# ������!���*� ���(�� ����������"��C����*������������� 0� ����

������������ 0� ����!�!����(�� �*������������.������ ��#����������O�������

�#�� !�����*�� ��*���3.����!�������� ���������#���3����,���**�*) �#�����

����������%1�$%��

�������� �*� �"������5���*����"���!����*�������������������3�� #���

- 8����

�������� �*������ ��� �����!���!��G�

• ��!��3����� 3#����3���

• ������" �"�

• =�# *� � ���*�#���3����!��##� �� ����.���*�������"��*��������� ����

• �##� �� ����� �">���������������*������* !!����� �*��#���3�����

��*�����3����� ���*�����# �"�����##� �� ����

����!����� �"���3#�������������� �*��� ����*�"����1��

93������D��"F�� �(?� �!�.��6��D���@1��2!�(�F�+!����(�1�3�����K7

� "����/���������������� �*������ ������5�� ��#���������������������

��������!�� � ���#� ���#�����.��� ���# �����D#�� ���E������* �"������*�"����

�!�#������� �3��������#�����������������5������#�� ����!�����.����

� "����/��-��� �"������)�*�� �� ���������

Page 14: Oracle Text Technical White Paper

������������������������/��

�%1�����$$!%$%��

)��������+,"� � ��#��� .��������������� �*�������������#�� ���������3�H���

.���! �����G�

• &���"��. � �������*3 � ����������*�� *��������#�� ������ �*�>�

�� ���#�� ����������� ��B�!!� ��>��� ���#�� ������.��5�#>�����

• ��!��3������������� ������3��*���� 3#����3��� �������. � ��� ��

�*��#�� �� �"��

6)��+��*���!� �

�������������� ���� "�����#��������������A��� ����� �"�������������" ��G�

• 7�����*������� �"�������� �"�!���5�����*�� ����*���3����8����������

�������3����5�����*�����.���*���� .�����A������

• -����A��� ���������� �"�!������*�� ����" �����������8�����������

!������������ ������*���������������������

• (��������#��� �����-�3. � �"�5�����*��� ��(��������#��� ������

8���������#�������A����������� �"�(��������#��� ���������

5�����*���

• � �"� � ���!��������8� �"�!�00����*����������������"��"��#������ �"�

���� A�����8�������������!�������� ���.�����3�� �"��

• �����3��� �"��=�� ������!���������� ��������� ��#��#������

8�������������!������������ ������*��������� ������ �"��

��.���/���������3���!����A������#��������

�������� ��� �������

�L?>� ���������������3.����!���������*���3����

������*�!��3������3��A������

�99>������D>E� ���������!���*���3����������� ���������

����������������!������!����A�������3���

��D�DPE� ���������!���*���3����������� ���������

����������������!�������!����A�������3���

(���*������3�DL�>�L�=>�L�1>�L��E� �#��*����A������� ����*�������3��������

.����*�! ��*� ������������������.���*������

� "������������3��

�E>�M�������DQE� �#�� ! ����������#�.�����.� � ���!��������*�

����A������

N<OOF �#��*��A��� ����� ����*�����*���������

�#����*�� 3 ��� ��������#�� ! �*���3��

Page 15: Oracle Text Technical White Paper

������������������������/��

�#����*�� 3 ��� ��������#�� ! �*���3��

�21�� � �*������9&��*���3����������� ����

�#�� ! �*���� ���#����

��1�� ���������#��� ��9&��*���3�����

�D��� 2��� ����&�������� ����.�������A��� ���

&)<8��DPE� ���������!���*���3����������� ������A�����

��3���*������������#���������!��������*�

A�������3������������*���3�����.�����5�*�

�������

<���������3�D��>���=>���1>����E� �#��*����A������� ����*�����������3�����

�����.����*�! ��*� �������������������

��������������������������3��!������#�� ! �*�

��3��

���3�D@E� =��������������.���*�������#�� 3 ���!����

���3����A�������3���

�?��DRE� ���������!���*���3����������� ������A�����

��3���*������������

?3�DSE� ���������!���*���3����������� ���������

����������������!������!����A�������3���

��!����*����3�D1�E� =�#����������3� ����A������ �����#��!����*�

��3��������.����*�! ��*� �������������!���

�����3��

=����*����3�D3�E� �#��*����A������� ����*�����������*���3��

��������.����*�! ��*� �������������!������

��3��

����*��D�E� �#��*��A��� ����� ����*�����*����������

� 3 ��������*�@���� �>����*���������*�� 5��

��������*���

��3�DQE� ���������!�����3���������������3��

� �"� � ������������A�������3��

����*�2������#���� ���D�2�E� -�����������*�A������#���� ��������*�� ��

���9��)E>�3@+2�?3�)2E��#����*�����

2@����3�� �#��*����A������� ����*�����������3�����

�����.����*�! ��*� ����������������������3��

!�������#�� ! �*���3��

��������*�DTE� �� 3 �����*���3���� �����������������

������.��������������*���3.������� ��

�#�����������A�������3����������������

*���3���.���*������������3�������� �����

*���3����

Page 16: Oracle Text Technical White Paper

������������������������/��

������� ������3�D�3E� �#��*����A������� ����*������*�! ��*�!��� "��

���"��"���A� ��������3���

������� ������3�������3�

D�32@�E�

�#��*���A������� ����*���������*�! ��*�

!��� "���A� ��������!����A�������3�>����

������3���!�A�������3>���*����!��� "��

�A� ��������!����������3���

��#����3�D��E� =�#����������3� ����A������ ������#���3�

�������.����*�! ��*�!��������3� �����

���*��*�� �������� ��������������

%� "��DUE� &�� #� ������������.�����" ����!����>�

�## �"������+,,�������������������*��

+,,��

����� <���������A�����*���� ���*���3���

��� �����

��.���/��-��� ���2������#���������33����

�%��%�$!%��$5�$!%�

�����"�� 0� �����#�����"��.����>�3�� � �"����!�������.���3�� 3#�����!���

����*� *��* �� .��*��#��� ���������#� ����#�����>�� .��� ������������

3���"�3�������3�����*��������������������������3 "��.��������*� ��

* !!��������"��"����������*�*� ��* !!�������������������% ������ ����!�9&�>�

3�� � �"����3��*�����*����������������#�. � ����������3�� �������#���

!������

������������##���������������<�����������'������������3#��>���-))>�8��'

�>�:�+��:)�>�6(7>�()6�>������������������##������������������*���3���� ��

����������"��"���D��"� ��>�������>��#�� ��>�6��3��>����E>�:�#�����>�7�����>�

���* ����>���*�� 3#� ! �*�-� ������

% �������3�� � �"����!������>�����������*�����#������'���"��"���������

�##� �� ������*G�

• & ����"��"���� � ����*���3��������� ���D��"��-� �������*���"� ���*���3���E��

• 8�����"� �����A�������"��-� �������3������ ���������������!����� �"�A�����! �*��#��*����������*���� # ������� ���K3�� ��V���� ��-� ������A� ��������

��*�!��!���.�6 ,�� <!�)� ,�� <!�)��"�-��",�� <!�)��-��"�����$����!�������.

,�� <!�) ��!��,���� /�32@�."������ 9������6/ �6�J�� ���F�!���.�6 ��!7

���������� ����� �*����?��3���"��.�� 0�*�

��" �����

Page 17: Oracle Text Technical White Paper

������������������������/"�

� "����1���������������!���3���!������!�������� ��-� ���������� "������

�����������3��!�������� ��:�#���������

� "����1��&�� � �"������������ �����3�4 "�� "� �"��!���-� ���������3����

� "�������&�� � �"������������ �����3�4 "�� "� �"��!���:�#����������3����

Page 18: Oracle Text Technical White Paper

������������������������/&�

�!�)7�%����8$�� �

����������#��� *���� "�� "� �">�3��5�#>��� ##�>���3��>���*�" ���������

3� ��� �!������"�������� ���#���!����� ��������.����������!���!���.���� �"�

����" �����*�!���*���3���#������ ���������������#��� *�� �!��3� ���

!��*.��5������������

�$�4�$�4$%��

����� "�� "������ ����5�����A������� �">�!���������*���3���������>���*�

������������ ������*�� �����*���3��������� ���3�������A�������

,��9)*�

&��5�#��5������� "�� "������ ���������#�!�����>���*�#��*������������� ���

�!����*���3���� �����3��� �"����*��3��5�*��#��� "��������������

�����������!����4�&��*���3���� �������3��I������J���*�I9�2�J�

� "�� "��*��

� "��������4�&������3���� ��4 "�� "��*����3���

�%$**��

�� ��*���3������� ��� �����!���!���#��*�� �"��������# �����!���� ��

5�����*��� "�� "��*����� �� ���������#�#��������� A������" ���������������

*����!��������*���3��� ���.���.�!�����#��� ���� "�����������������3#���

�!�������������� ������ ���!���#����� �"�����������������

��������������#������������*�*���3����� ��

A������ "�� "��*���3�>�3��5�#>��� ##�>���3��>�

��*�" �����

Page 19: Oracle Text Technical White Paper

������������������������/(�

� "������������3����� ##�� ���������=������ ������ ���

�����##��3�����* ������������� �"���#�. � ��>�����������#��� *���

�*�����*�� �"� � ��!�������������� �"� � ��!������� �����*���3������� ����

���.���������"�������*���3�����3��������3����33�� ��>���'*�3��*���*�

#��'*���3����

�4�7������$!%�

��I���3�J�#��� *��������#�������*���� .����������*���3��� ���.����

=��������������� �"�!���*���3����������� ���#�� ! �����*�����#������>�

�����������������!���*���3������������.��������� ����.H��>������ !����

��.H��� �����3�� ���*��#� � ��� �����*���3�������3��A��� ������������ �

� ���!������*���3������������.��������A����*���.H��>�����"�� ����������

��� �* �������������"��������*���3�����!������������.H��� ��A��� ����

� "�����������������#���!���3������ �������*���3����.���:������*�

:������#����

��

� "����������3������ ����!�������3����.���:������#�����*�:�����

Page 20: Oracle Text Technical White Paper

������������������������ 0�

3$ ��

��6���� ��6 �� ������33�������� � �"��!����������������#���"��#��>��� ���

.�����#�������������������.H���3�����!����*���3����O��������������

6���� ��6 �����5 3����3� ���������!�����>���������������� ������ �����

�V����.H���3�����O�������"�������#���"��#�'����������������'������" ����

�18�%��1�#��)�� �

��� $'$��$!%��%1���) ��$%��

���*���3�������� ! �� ����##� �� ��� �������������� ! ������ ���3 �"�����3�

�!�*���3����.���*������ �����������������##� �� �������������5��������

*���3������ �"����! ��� �"��##� �� ������������3#��>������� ���������"�����

3 "�����*�������� !�� �� ���3 �"�����3��!��� ��������������� ��� ���

���"�� �����������#�� ��>������3�>�����#�����

�����������!!��������3.����!����� A����!������# �"����������������.���

����"��!�������� !� �"��������

��������'.���*��##���������� ����!�������*�! � �"����"�� ���D�����E����

�#�� ������*���3����.����"�����3�������� �����9��3>��� �*���#�>�

����##� �� ��� �*�������������DA��� ��E����*�! �������� ! �� ���������� �"�

�� �� ����%����*���3������� ��>�������9�2��#����������.�����*���

���"�� 0�������*���3������ "���������������3� �����������!�������� ! �� ���

�##� �� ����

� "����������������!���-���� ! �� ����##� �� ���

-���� ! �� �����*����5�����*"�'.�������������

��3#������!���.� �* �"���3 � �"��##� �� ������

-���� ! �� ���

�##� �� ��� ��!��3�

�� ���

)���3 �"�

*���3����

&����*�

*���3����

-�3#������

�"� ���������

+,��

Page 21: Oracle Text Technical White Paper

������������������������ /�

����#��� �����##��������A� �������������#��*� 3����! � �"�A��� �����*�

����� �"��.�������� ��������� �����������"��*�������� ���##������*����?�

�������#����

��������� ! �� ����� � �"��##���������� ����!�������#��� * �"�������!���3#���

*���3����!��3����� ����.H����������9��)9�2�#��5�"�������5�������� � �"�

�����*�"�����������3� �������������������*� *�� !��*���3���� �����

��.H����������������������3���*����� ��.��G�*�� � ����������*���##���������

3��� ����D�;&E���

� "����$������������3#����!�������� ! �� ����##� �� ���!������3�* ����

*�3� ��������� "��� ������������*���3���� ��� "�� "��*�A�������3��

D�����!� ����E���

��

� "����$�����-���� ! �� ����##� �� ���!������&�* ������3� ���

�-����������������� ! �� ��>������� �"� ���������#��� ��*������ ! �� ����!�#������ ���"���#���������������!!�������9��)9�2+9�>2��3��=�#��5�"��

!���.� �* �"���������������#��5�"�����3� ��������������������!�*���3���������* �"����� ����3�� ��3��� �"������������������� �������.����!�*���3�����!���������� ��������*���3��� ����������� ��.�� ���*���.��3����� 3 ����� ������������ �� *����������������� ����� *��*���3������������������3���*����� ��.��G�5'3�����!���!���#�� �� �"���*�� ������ ���������� �"���� "����+,������������3#����!������� �"����

Page 22: Oracle Text Technical White Paper

������������������������ �

��

� "����+,��-����� �"�-�����!������&�* ������3� ����

:%!;��1���.� ��

���������V��5�����*"��.���>����� ���������,,>,,,������#��!��3������.���*�

*�3� �������� ! �*� ���/,,,�3�H������"�� �������������"�� ���������"�� 0�*�

� ������ ��������*���� ��#���3�G�.�� �������*������3 ��>��� �������*�

�������"�>�"��"��#��>�"�����3�����*�3 � ���>���� ������ ���3��>���*�

�.����� *������*������#���-����#������ ! �� ��>���� ����!����"�� ��>���*����

� ������ ������"�� 0� ���������������!�����*�� "��*�!����� �����!������� ��

�!��3� ������ ��������������������" ����#�� �>�� �����#�� ���!��������

��� * �"�#��.��3���!���3�� ���3. "� ������

8������������*���*�����3 0��� ��5�����*"��.����.���** �"�������3�����

��*�! � �"�� � �"��������������3#��>����������� 3#�����3�* ���������������*�

��������*����5�����*"��.������� "����++���������� ������ ����� ����!���

3�* ��������������

Page 23: Oracle Text Technical White Paper

������������������������ ��

� "����++��&���" �"������������������ ��

���#��,�2���

� "����+/���������#��!��3�������3#�� �����!������������ �"����!����(��

�*���#��������������!����.��'5������#�� �� ��������������" ���>��� ���

�����!��������I�-�& J����)��"������>�����������#��!��3����� ���.������

��3�������! ��'.���*�������������" ������� �"��'����>�� �"��'A����������(�����

�������3� ��������*>�������V����#�� ��������. � ��3������������������

A� �5�����#��!��3�����! ��'.���*���" �����������.������������ 3��� ����!����

�������(�� ������ ������ �"�������3����*�#��3�����3��� ������

� "����+/�������"�#��-�3#�� �����

�����������*����"�G���������#��!��3�������

�4�!)�4*)��!7*��$ !%

����

�����

�����

�����

�����

�����

����

����

�����

� �� �� ��

2)7<���!'�� ��

6)��$� �*������!%1

� �����

�����������

������

�� ��

�����������

������

Page 24: Oracle Text Technical White Paper

������������������������ ��

� "����+1������������3����>�.����#�� �"�A����� 3����������������"�#���

� "����+1��2������ 3��-�3#�� �����

���23�������������

)��� ����� ��>����#��������3���������*����"����3#����!������3�H����������

���!�������*���� .�*��.�����

����$%���%1�� �;$4�����������

���?������3�����!����� �"��.������� � �"���3���# ����#��*��� �!��3� �����

��!����,�� <!�)��-��"�������"��<**R�F,�PPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPP13?D>9�)�D�?��>���>�L�3.S613?D>9�)����M�39�3T.�J613?D>9�)D�293�1��?�M�39�3T.TJJJ69���=?3@�>�L�3.T613?D>9�)2���>2M�39�3T.TJ6��2�)13�9��>�L�3.U T6

%������*�� 5�������������� �*��������13?D>9�)D�293�1��?������3����

3�5�� ��������.��������� �*������ ��� �����2�����3��G�

6)��+��$7���!7*��$ !%

���

����

����

����

����

����

����

����

� �� �� ��

2)7<���!'�� ��

6)��+��$7

��=/004 �!'��� ��!%1>

� �����

��� ��!�"�#���$

� �����

%&��' ��"�#���$

�� ���%&��' �

Page 25: Oracle Text Technical White Paper

������������������������ ��

93������D�� ��!��,����)� (?�,�� <!�)��-��"�����.,�� <!�) ��!��,����6��D���@1��29��2@2+9?�����7

������ �"� ����������2�����3��G�

2���9��!���.�6 ,�� <!�)� ,�� <!�)��"�N3?�,�� <!�)��-��"�������3�9?�����2.,�� <!�) ��!��,���� /"���������3A��#�����*<����A/ �6�J?3D�3L@�!���.�6D�29729?3�.�613?D>9�)�D13?D>9�)����PPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPTVKKK��������T��3TWKJSJ��������W�3�X�WTS�9D����������1��XKJ�X1*��"���������J��=��XTT�T�������T��3���XTTXK��������W�3�N

���* ������*����� ��>������ �*�������������������*� �����*��.����������

���������� �*������ ����!�!�����.���>���!����*���������W)>�W7>�W<���*�W=�

�.�������#�� �����������.����� ��� � ���������3���!������ �*�������>�

��*��������3������������*�!��3�D3Q>������3���!���� �*�>���*������!! �

D��"��Q�E����

����W)��.������� ����!���������5������������.���� �*��*>��"������ ����

. �������#������ ����!����*���3�������������� �>���*��� ��#�� ����� � ��

�����*���3����������*���3��� ����#������*�.����� ���������-)����������

����W7��.��� ����� �*�'��"�� 0�*��.���D)��E��� ���3�#�� ���������-)��

����������������=�%)������������������� ������.������� ����!���� �"���

��-)�B=�%)��#� �������)����������!�����# *���� ������!���-)��" �������

������#��* �"�=�%)����������

����W=��.��� ��*�� "��*�!�������##�� �����5�#�!��3����W7��.���'�!��� �"���

=�%)�����������5���������-)����������

����W<��.������� ������ ���!�*����*���-)��������>��� ��� �����*�D��*�

������*��#E�.����� �*���# 3 0� ���#��������

2���9����*�)��"�N3?�<���)���*��7��L��)����PPPPPPPPPPPPPPPPPPPPPPPPPPPPPPD3QD�293�1��?�)�D�Q�D3QD�293�1��?�)�D�QHD3QD�293�1��?�)�D�Q�D3QD�293�1��?�)�D�Q313?D>9�)��N?3����?�

%������A�����!������ �*����3�G�

Page 26: Oracle Text Technical White Paper

������������������������ ��

2���9��� �()��"� ���*�)��"� !�*<"�)��"�N3?�<���)�� )!�*<"����3����*�)��"�:/13?D>9�)��N?3����?�/��D��)������L��)����9?�>��)����PPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPD�293�1��?�)�D�13?D>9�)��N?3����?�13?D>9�)D�293�1��?�

%�����������I� �J����*��.�����# 3 0����� 3#�����A�����#��!��3����� !����

5��������*��!� 3������#���� ��.��G�

2���9��'I�� �(,�� <!�)��-��"����� ��!��,����)� ('��!���.�6 ,�� <!�)� N3?�,�� <!�)��-��"�������3�9?�����2.,�� <!�) ��!��,���� /"���������3A��#�����*<����A/ �6�J��D*���),��!���JJ7

����������3#�����������*��*��2����3 ��������'.���*�#��* ����� ����

����� �������� �����#��* ������

%��������������#�� ��#����!��������#���!�A������������3#��G�

2���9��!���.J6�!� � �<���� ���*�N3?� �!���3�9?�����2.��(� /"���F/ J6�J�� � ��S?3D�3L@�!�D�2973�$��(�!<����1*��PPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPJ2���9�2��������=?���9??2�J2?3�.?3D�3L@6J��L���99�22.L@��D��3?��D6?N/D?92/JL����19?�M�32�?�.�?3?��D26JL����1��DJL����19?�M�32�?�.N3?�3?��D26J2?3�.?3D�3L@6JD?������D��?N/D?92)����/JL����19?�M�32�?�.N3?�3?��D26J2?3�.?3D�3L@6J��D��.3��=�29��6?N/2@2)9JJ�TTJ/.>��E>�6

%��3�� ���*����� ������������������##������3����������#'.���*�

��� ������� �"�����L?>���#�������� �����������3���!��3�!������A��� ���

��3�����"� �����3��� ����� �����*� �*����������3#����������������� ����

������� ������.����� �������� !�������!����*���3�������� ���������*�

I�� �J��

2���9�� ���*�N3?���$�)���*���3�9?�����2.����!*� ����<�.�����6�6�J7

Page 27: Oracle Text Technical White Paper

������������������������ "�

� ���*�PPPPPPPPPPPPPPPPPPPPPPPPPPPPPPPUKX3��*�����,�����������<��,��

������3��.���*�!������� ������������C����3��>��(�8��A��� ��>�" ��>�

�(�8��A������ "�� "� �">���*�� ������ ����A�����!��*.��5�C��*�#��*�������

�������5�����*"��.�����

����#������!�����������*��.����3�5���#��� .������������� ����!�3�� '

*�3� ��A��� �����������3#��>�! �*������3.����!�#� ������*��������,>����

� ���� � ��1��53��!�������>��������*���!�3 ���3�* ����� ������!����������*�

�����3�5�>���*�"���� �������'�����

2���9�!�<��.,6 ,+�#� ,+(��F N3?�,�������, !�����!��3�,+�#���J��D!+��"�:Y����������D2D?)�����)D�2���9�.,+*�! !+*�! Y�:K��"�6��D9�������.,+"� �!�*)������F Y�"���!��!���6�J=3?>1L@,+�#�7��

������� �*���#��� ��������.��*������ �"���������������#� ���&���"���

D��&E��*3 � ��� ���������� "����+����������������������� �*��!��3�

��&��

��

� "����+���&���" �"�����������!��3������������#� ���&���"����

Page 28: Oracle Text Technical White Paper

������������������������ &�

�,���)**!��

�9&��!������� ����*������#������%)�4)<>�����*���� ���������>��������

� � ���� .���������>�3�## �"�3�� #����"���������3����3�>�#��������� �"�

�� �"�)< ��4���*�4�� ��4��#��������

��?���������!����� �"�9&����3#�����*�3����������������?��!����������R("*5������:A�+JAR��N�E?���3:AL�**F��(�A��������?��!*���(�N�E���������D�293�1��?���5��F����#F�<�*$�F�$���� �����$���<���(���D�293�1��?���E>�2��?��������?��!*���(�R��E>�2��?�����2��3�?��!*���(�<������� �� 2E����� �( ����!� �� ���*FO���(��� �!<"��������� ����� ������� -�*����$�������+����2��3���N�E�

�� ������������������G�

�2���9����*� ��!��,����N3?�N�E���*���3�9?�����2.��(� �?��!*������E>�2��?��6�J7

�O�������������������.���� .���������G�

�2���9����*� ��!��,����N3?�N�E���*���3�9?�����2.��(� �L�**F�����N�EZ?���3�6�J7

� ��������� �"�����.��*������G�

�2���9����*� ��!��,����N3?�N�E���*���3�9?�����2.��(� �?��!*���1��.N�E������6�6�J7

� ����� �">��� ���*���3 ���� !���#���� ��>����5��� 5�G�

�2���9����*� ��!��,����N3?�N�E���*���3�9?�����2.��(� ��21��.N�E�������D�293�1��?�6�6�J7

�����4$%��'!���!%�%��%1� �)�)���$%��,��1!�)7�% �

����* �������*��.����������������*������������ ������������� ���������>�

.�����.����������3�� 3����������#��� *����� A���!�������������.���

A���� �"�!�����������*����������������3�� 3����

Page 29: Oracle Text Technical White Paper

������������������������ (�

������+,"����� ���*���*���������2��!��� �����(������ ����*�

�(���!������#���������9&���#��������G��

• �(������ �.6G�" �������9 ����#���� ��>�����5�� !����9 ���

�##� �*���������*���3�������������������� *���*�����

• �(���!�.6G�" �������9 ����#���� ��>��##� ������9 ��������

*���3�����*�����������!��"3��������9&���#���

%��������3. �������.����!��� ����� ���������#������!�������A�����

���"��"��!���������������������������3#��>���������������!����������2��

������� ��I���*��*�����2�J� �������������"���*�* �#�������A��� ����

��*�!�-+-�;+�(���!�./�N�E�E>�2��?����(�.6/6+#��2����#M�*.6-��"-�;-$����!�������.-�; /���� �� ��2E���1��.N�E���2��36/6�J��

���������������������2���������#�����

����� �������!������!�������#��� *�*�� ������������ �����*�.��������������

���� ���>����.����������8�������������*��������� �����

�����������������4�

�������8����������>���!�������!�������+,�>�� ������������##� �� ���.� ������#�

�!�������������������8�����������" ������������������3�� #�����#�� �� ��>�

���������������*��.����>�)&� ��������>����! �������3������ �� ����������!���

�������"�� 0� ���������3�� #���*���3�����#�� �� ��>�3�� #���)������� ���

����3�� �������>�������*����������������������� ��������

8�����������!!���G�

• 8� !��3��������C���*����������3������������� �!��3� ��� ��C� ��

��*��.���>�������)�����>�)�����>���� ������##� �� ����

• -���� �">� �*� �">���*�3�5 �"��������.�������� ������#�����

�������

• )��"�� ���� ��������+,"��� ����>�������?��#�����!��3����5�

��!�����!���.� �* �"����#�����#��������� �����

• ��������.������'.���*��*3 � ��� ��� ���!����!�������*�� �"�

������>�����3 0 �"�������>��##�� �"������#��!����������*��������

� "����+��������8�����������*3 � ��� �������� ���!�����

�������8�������������*������������ ���G����

�!!�� �"��.� ������#��!�������������

Page 30: Oracle Text Technical White Paper

�������������������������0�

� "����+����������8������������

�������#$�� �

�������� ����� � 0�������������!���������#��� *��!������ �*� �"���*�

��� �������#�. � ���!���*���3��������*� ��� ������%�������������������! ��>�

� ����.� �*��������� �*����� ��������������*������*��.��������������

*���3��?������������.���� �*��*>��������� ���������������������������*��

��*�#�����������##���� �����*���3������� "����+�����������*�����*��������

!��������

�������� ����#��� *������ �"��>��� ! �*���#�� ����!���3���" �"������#����!�*��>�

����* �"�*���3���>�3�� 3�* �>���.�#�"��>��'3� �>���*��������*�*�����������

���� ����!�����������*��.���>��������� ����#��� *�������� �.��>���� ��.��>���*�

���������� ���3���!���3���" �"����#������������

Page 31: Oracle Text Technical White Paper

�������������������������/�

� "����+�����*�����*�������� ���������� �����

?������������@�����

�����3.����!����� 0��*��!���:������#���������� ��.���!���*������*�!��3�

��<���% ������ 0��*?��� 3#�����*� �� �������� ���!���>��������!�3 � ���� ��

:������#���� ���.���.�����"�������� 3#����##� �� ����� 5����.� ����������"�

������ �"��� �"������������ ������* �"���� �"���� �����

� "����+����:������#������% 0��*��

Page 32: Oracle Text Technical White Paper

������������������������� �

�2#��,����2��������@����2�

�)�!��3� ���� ���� 0� ������� A�����������#���������� "�������"�����"��*���

�����!�*���3���������������� *���3� ������� �"��##��#� �����������)�����

������!������������������ *�� !�������������������� ���� 0� �������.��

���!��G�

+�� ����3��������G���#������ �!��3� ����.������*���3��� ���!���

/�� <����5���*�� ������ ������������G���#������ �!��3� ����.���

���"�� ��>��������>������� >���*�5�����*"��.������

1�� �������������G���#��������.� �������������#����!����������� ����� ��

�����#�� ���������!� �3�/��

���������!!��������������" ���!����*�# �"�� ���� 0� ��G������; �������*�)����� ���; ������

+�� �����; ����� �������*�'�'����:����� ���� 0� ����!�����������������

�����.�����*���* �#��� �"�����������*����"�� ����� "����+�����������

��3#���� �����"�� ����

/�� )����� ���; ����� ����:����� .�����!���.� �* �"�* !!������#����!�

� ���� 0� ���3��#������

� "����+����)�!��3� ���; ���� 0� ���� �������; �����

Page 33: Oracle Text Technical White Paper

���������������������������

��������2����2�������/0���������� �

����"�� ��� "� ! ���� ����3���� �� 3#��� �"�#��!��3����>�������+,��

���� �������3.����!�!��� ������������3��������������������3����*�� ��

*���� # ����!����+,����������/�!������� ����� ��.��� �����I������������������

����� ��J��

• <�������!�! ��������#��� *��.����A��� ����*�#��!��3�����

• -� ����>�7�����>���*�:�#��������##���!��������� �*���#���

• ��� ��� �*� �"���##���!���������#�� ���*� �*���

• <����N*����� ##��#��5�"��!���#��*�� �"�� "�� "��*�5�����*� ��

�������33�� ����

• & �*��������##���!���-� �������*�:�#�������

��2������2�

��������������.�����##� �� ���*�����#����������#������� ����*��#����!���

�������� �"���#�. � ��� ����� ���##� �� ������ �"�����#��"��33 �"�

���"��"����)�3�5�������������3���.���! ���!���� �*��� ��'����"��*��.����

��� ��.��>�� ������������!������ �"���*���##�� �"������ )����*�*�#� ���*�

*���������. � ����! �*�*���3����.���*������ ������>�������3��*��>����

�� .���>�3�5�������������*��.�������� �"���#� ���!� ��"�� ���!�������*���

3���"�3����

#������������23�

�+������������=�!�������6� *����������-��#�>�=�*���*�������>�-��D/,,�E��

/�������������##� �� ���������#��?��6� *����������-��#�>�=�*���*�

������>�-��D/,,�E��

1��)�!��3� ���; ���� 0� ���� ��������+,"����%� �� �#����

������������4�3�� �"��D�#GBB������������3B#��*���B�BE�

������������� ����� �������3�D�#GBB������������3B!���3�B���3�E�

Page 34: Oracle Text Technical White Paper

�����������4$����*���

�*�$�� 00��

�)4!�A��7�����!% !�

�!%�$<)$%���)4!� A���%1��*�%�.�%��B��C���8��.)!%C��!����#!�1C��%1��$�4��1��$ D�

��������!�*!��$!%�

�!��1����1E)���� �

�00�����������9;�+�

��1;!!1��4!�� C����(�0���

�D�D�D�

�!��1;$1���%E)$�$� A�

�4!%�A�F/D��0D�0�D"000�

#�A�F/D��0D�0�D" 00�

;;;D!�����D�!7�

��������!�*!��$!%�*�!8$1� �4�� !';����

4��*!;�� �4��$%��%�D�

�������$ ������$ ���1���1�7��9�!'���������!�*!��$!%D����$!) �

*�!1)���%1� ��8$���%�7� ���'���%��1�4���$%�7�+�<����1�7��9 �

!'���������!�*!��$!%D�����!4���*�!1)���%1� ��8$���%�7� �

7�%$!%�1�7�+�<����1�7��9 �!'�4�$���� *��$8��!;%�� D�

�!*+�$�4�G� 00����������!�*!��$!%�

�����$�4 ��� ��8�1D�