מסמלים לשפה - יצירה אוטומטית של טקסט מסמלי בליס



מסמלים לשפה - עיבוד שפות טבעיות בתקשורת תומכת וחליפית ויצירה אוטומטית של טקסט מסמלי בליס

יעל נצר

המחלקה למדעי המחשב

אוניברסיטת בן גוריון,

באר שבע

yaeln@cs.bgu.ac.il

מבוסס על עבודת דוקטורט שנכתבה בהנחייתו של ד"ר מיכאל אלחדד

הקדמה

תחום תקשורת תומכת וחליפית (תת"ח) עוסק במציאת שיטות ועזרי תקשורת המתווספים לצורות התקשורת הבין אישית הטבעית (דיבור וכתיבה), בעיקר כאשר יכולתו של האדם לעשות זאת פגועה. מערכת תת"ח מוגדרת כסך הרכיבים, הסמלים, העזרים, האסטרטגיות והטכניקות המשמשים להגברת קצב ויכולת התקשורת של אדם. המחקר והתעסוקה בתחום כוללים קלינאות תקשורת, פסיכולוגיה, רפואה, הנדסה, חינוך ועוד.

לוחות תקשורת הם עזרים המשמשים ליצירת הודעות, ועליהם מוצגים סמלים מסוגים שונים (אותיות, מילים, תמונות, צלמיות). התקשורת מתבצעת על ידי בחירת רצף סמלים מהמבחר על הלוח, רצף אותו מפרש בן השיח כמשפט מלא בשפה טבעית. אם השימוש הוא באביזרים אלקטרוניים, לכל סמל מותאם פלט קולי.

עיבוד שפות טבעיות (Natural Language Processing – NLP) הנו תחום מחקר במדעי המחשב ובבלשנות הבודק ומשתמש בידע לשוני לפיתוח יישומים מבוססי-טקסט, כגון תרגום אוטומטי, תמצות טקסט, מערכות מומחה, יצירת מסמכים וכן הלאה. כמו כן נעשה מחקר המשתמש במודלים חישוביים לתיאור תופעות לשוניות (שלא כמו בבלשנות תיאורית).

שני היבטים עיקריים ב-NLP הם הבנת שפות טבעיות – Natural Language Understanding – NLU)) ו- יצירת שפות טבעיות (Natural Language Generation – NLG). בתת התחום המתייחס להבנה של שפות טבעיות המחקר מתמקד בזיהוי היחידות המורפולוגיות של השפה (ניתוח מורפולוגי), בזיהוי מבנה תחבירי של צירופים ומשפטים, בזיהוי מבנה שיח, ובעיקר במציאת משמעות של המבעים הנתונים. הקושי הגדול במחקר נובע מרב המשמעות הקיים ברבדים השונים של השפה הטבעית.

המונח יצירת שפות טבעיות מתייחס לתהליך יצירת מבע בשפה מדוברת מתוך ייצוג ידע בפורמט אחר (סמנטי), בתוך שימוש במשאבים לשוניים. השימוש במערכות מסוג זה מיועד בדרך כלל לייצוג ברור של מגוון נתונים (במערכות מומחה, דוחות המבוססים על נתונים מספריים) וליצירת מסמכים פורמאליים הדורשים עדכונים לעתים תכופות. בכמה מהיישומים משולבים רכיבי NLG כחלק מהמערך הכולל עם שיטות אחרות של עיבוד שפות טבעיות, כגון תרגום אוטומטי ותמצות מסמכים.

מערכות יצירת שפות טבעיות שמייצרות טקסט ביותר משפת יעד אחת נקראות מערכות יצירה רב-לשוניות (Multilingual Generation – MLG). מטרת מערכת כזו היא ליצור טקסט במספר שפות יעד ללא צורך בתרגום.

המחקר המשתמש בשיטות לעיבוד שפות טבעיות למטרות תקשורת תומכת וחליפית (תת"ח) החל להתפתח בעשור האחרון, ואף התקיימו מספר סדנאות במסגרות כנסים בינלאומיים (למשל ב-ACL 1997)[1]. בשנת 1998 הוקדש גיליון של כתב העת המדעי Natural Language Engineering לנושא. מכיוון ששני תחומי המחקר עוסקים ביצירה או בהבנה של שפה בצורה מלאכותית, השילוב ביניהם אף מקדם כל אחד מהם בנפרד. מספר מחקרים אף נעשו בתחום הספציפי יותר של יצירת שפות טבעיות ותת"ח.

במאמר זה אסקור תחילה מגוון שיטות שונות לשילוב NLP בתחום התת"ח, ואחר כך אציג את עבודת המחקר שלנו, שמציעה שיטה חדשה ליצירה אוטומטית של טקסט מתוך לוח תקשורת דינאמי של סמלי בליס, ואציג מילון בליס מקוון לעברית ולאנגלית.

שילוב שיטות מעיבוד שפות טבעיות במערכות תת"ח

הבעיות והמטרות בפיתוח המערכות

השימוש בשיטות מעיבוד שפות טבעיות במערכות תת"ח (NLP-AAC) נעשה לשם הגברת קצב ההתקשרות והגדלת יכולת הביטוי של המשתמשים, או להקלה על קריאה של טקסטים. היישומים העיקריים כוללים יצירה אוטומטית של הודעות, הרחבה של כתיבה בקיצורים, ניבוי מילים ופישוט טקסט.

הבעיות שמערכות כאלה מנסות לפתור כוללות את הפרמטרים הבאים:

• הגברת קצב התקשורת (25-2 מילים לדקה אצל משתמשי תת"ח לעומת כ- 150 מילים לדקה בשיחה שוטפת ממוצעת). הגברת מהירות נעשית, בהרבה מהמקרים, על ידי צמצום מקסימלי של מספר התווים (סמלים) הנדרשים להקלדה או לבחירה של המשתמש.

• התאמה של מערכות קיימות ליכולות קוגניטיביות של משתמשים (למשל מערכות לפישוט טקסט) והקלה פיסית/מוטורית של משתמשים על ידי חיסכון במספר הבחירות הנצרכות כדי לבטא את שרוצה האדם לומר, תוך שמירה (ואפילו הגברה) של כוח הביטוי והעושר השפתי של כלי התקשורת, בפגיעה מינימלית בעומס הקוגניטיבי על המשתמש.

בפסקאות הבאות אפרט קצת יותר על סוגי המערכות הבאות:

• ניבוי מילים וסמלים Word / symbol prediction

• הרחבת קיצורים Abbreviation expansion

• פישוט טקסט Text simplification

• יצירת הודעות Message generation

ניבוי מילים וסמלים

מטרת מערכת לניבוי מילים היא הקלה בהקלדת מילים בתוכנות טקסטואליות על ידי ניחוש המילה הבאה שתודפס או מתן אפשרויות שונות לבחירה.

תהליך דומה קורה בהתנהלות טבעית של שיח בין משתמש תת"ח ובין בן שיחה מדבר, המנסה להשלים את הנאמר על פי הידע שברשותו על השפה ועל ההקשר של השיח [Garay-Vitoria and Abascal, 1997].

מערכת לניבוי מילים יכולה גם לסייע לכותב דיסלקטי על ידי צמצום מספר טעויות הכתיב.

[pic]

איור 1 דוגמה לניבוי טקסט

השיטות המקובלות לניבוי טקסט מבוססות על מידע סטטיסטי (ההסתברות של מילה תופיע לאחר המילה הנוכחית), על מידע תחבירי (התחשבות בחלק הדיבר של המילה הנוכחית או של המילים שהוקלדו עד כה), ולעיתים גם על מידע סמנטי (על ידי שימוש בקטגוריות שונות של מחלקות סמנטיות).

בשפות שהמורפולוגיה שלהן עשירה בהטיות, ניבוי מילים בעזרת מידע סטטיסטי הוא קשה יותר, ויש צורך בהוספת המידע התחבירי או הסמנטי.

למימוש מערכת ניבוי מילים נדרש ידע לקסיקלי הנלקח מתוך קורפוס ומתוך מילונים. מערכת טובה של ניבוי מילים מתעדכנת בזמן השימוש על פי אוצר המילים של המשתמש.

הערכת יעילות מערכות ניבוי טקסט נעשית על ידי ספירה של מספר ההקלדות שנחסכות למשתמש והתחשבות בעומס הקוגניטיבי שנוצר, ומערכת תהיה טובה יותר ככל שיצטמצמו מספר התווים המוקלדים והבחירות האפשריות המוצעות למשתמש. בממוצע, מערכת כזו חוסכת 50% ממספר התווים שצריכים להיות מוקלדים בטקסט (בשפה האנגלית).

גם למשתמשים בתקשורת עם סמלים כסמלי בליס פותחו מערכות לניבוי. העבודה של [Waller and Jack, 2002] משתמשת בניבוי על פי הסתברויות בתרגום מבליס לאנגלית.

מערכת אחרת, שפותחה על ידי [Gatti and Matteucci, 2005] ונקראת , CABA2L משתמשת בשיטות הסתברותיות ובחלוקת הסמלים לקבוצות תחביריות וסמנטיות לניחוש סמל הבליס הבא (בדומה לניבוי מילים). המערכת שילבה תוכנת עריכה מסחרית Bliss2003, והראתה חיסכון של 60% במספר הבחירות הנדרש לאמירת ההודעה הרצויה.

הרחבת קיצורים

ניבוי מילים מאץ את קצב התקשורת אבל יכול ליצור עומס קוגניטיבי על המשתמש, מכיוון שאין הקלדה שוטפת ויש צורך בבחירה של אפשרות מתוך תפריט או תיקון כאשר הניחוש מוטעה. שיטה אחרת להאצת קצב ההקלדה הוא על ידי שימוש בקיצורים.

קיצורים יכולים להיעשות על ידי קידוד נומרי או אלפביתי (או שילוב של השניים) ושימוש בטבלת קיצורים נתונה, המוגדרת על פי רוב על ידי המשתמש. זוהי שיטה פשוטה וישירה, אבל דורשת מהמשתמש לזכור קיצורים רבים ויכולה ליצור עומס [Moulton et al., 1999].

[Shieber and Baker, 2003] פיתחו מערכת שבה המשתמש מכניס טקסט באנגלית ללא תנועות (vowels ),אלא אם כן הן אותיות ראשונות במילה, וללא אותיות זהות ברצף. ההרחבה נעשית על ידי שימוש בשיטות הסתברותיות של מאפייני השפה. קלט לדוגמה יראה כך: an exmpl of 5 wrds ויורחב ל-an example of 5 words. החיסכון במספר ההקלדות עומד על 26.5%, והטעויות הן בסדר גודל של 3% מכלל הטקסט המוקלד.

פישוט טקסט

במקרים רבים של אפזיה נגרם קושי בקריאה ובהבנת טקסט. הבעיות העיקריות כוללות:

• הבנת משפטים מורכבים בייחוד עם משפטי זיקה

• קושי בהבנת משפטים במבנים מורכבים, כגון סביל

• Anaphora resolution

קושי יכול גם לבוא לידי ביטוי בהבנת מילים שאינן נפוצות בשפה.

מערכות לפישוט טקסט מבצעות טרנספורמציה של השפה בטקסט וניסוחו מחדש במבנים פשוטים ובמילים פשוטות יותר. קיימות מספר מערכות (לפישוט טקסט באנגלית), כגון PSET [Carroll et al., 1998], או ENDOCRINE [Liben-Nowell, 2000]..

תהליך פישוט הטקסט נעשה בשני שלבים:

1. אנליזה – ניתוח תחבירי והסרת רב משמעות (אם ניתן)

2. הפשטה – יצירה מחדש של המשפטים במבנים פשוטים ובשימוש במילים פשוטות ונפוצות יותר

האנליזה נעשית בשלושה שלבים: זיהוי מילים, ניתוח מורפולוגי וניתוח תחבירי. ההפשטה מבצעת Anaphora Resolution, כלומר זיהוי קודמנים (antecedents) על פי הקשר בטקסט, הפרדת משפטים מורכבים או ארוכים למשפטים פשוטים וקצרים יותר ופישוט לקסיקלי.

חשוב לציין שמערכת כזו מצליחה במשימות השונות בממוצע של כ-80%, ומקצרת את זמן הקריאה של טקסטים.

[pic]

איור 2 דוגמה לפישוט טקסט באנגלית

יצירת הודעות

אף שחלק מהשיטות שתוארו לעיל משמשות ליצירת הודעות (או מבעים), אני מכלילה בקטגוריה הנוכחית מערכות שלא נועדו להאצת קצב התקשורת אלא שנועדו לשמש ככלים לתקשורת (לוחות תקשורת) המכילים סמלים, אותיות או מילים, ואשר יוצרות משפטים מלאים מתוך רצף חלקי של סמלים.

בקטגוריה הזו אתייחס לשני סוגים של מערכות: שליפת משפטים ומערכות מבוססות NLG (יצירת שפות טבעיות).

שליפת משפטים מוכנים בצורה אוטומטית משמשת, למשל, במערכות לסיפור סיפורים, כשהמטרה היא לאו דווקא תקשורת מיידית אלא מתן אפשרות לספר סיפור בקצב תקשורת מהיר יותר. לדוגמה, במערכת Talk:About של חברת Mayer-Johnson, שפותחה, על ידי [Waller et al., 2000a], סיפורים מאוחסנים מראש ונשלפים במהירות לאמירה ולעריכה במהלך שיחה. הסיפורים מקוטלגים על פי נושאים ומוצעים למשתמש במהלך השיחה.

שיטה אחרת,SchemaTalk [Vanderheyden et al., 1996], מציעה למשתמש סכמות סטריאוטיפיות של שיחות ותבניות של משפטים עם אפשרויות למילוי הפרטים. למשל, בסכמה "קניה של אוכל בחנות" נמצא את התבנית I want to buy כשעבור תוצע למשתמש רשימת מילים שיכולות לשמש כמילוי מתאים. הערכת השימוש במערכת מלמדת שאורך השיחות בעזרת המערכת גדל כמו גם קצב המילים הנאמרות בדקה.

במהלך עשרים השנים האחרונות פותחו כמה מערכות שמשתמשות בשיטות של יצירת שפות טבעיות (בעיקר במסגרת מחקרית). מערכות כאלה דורשות ידע לשוני רב יותר, ולכן היקף השפה שבשימוש מוגבלת יותר.

המערכת הראשונה, BlissTalk, פותחה על ידי [Hunnicutt 1986] (לשפה השוודית). המערכת היא לוח תקשורת מיועד עם 504 משבצות, שברובן הופיעו סמלים בבליס, וחלקן הוקדשו לתפעול המכשיר. הסמלים אורגנו על פי חלקי הדיבר, Bliss Indicators, ועל פי פונקציות תחביריות, כגון זמן ועוד פונקציות כמו "דמיון מושגים", "צירוף סמלים", מספרים וסימני ניקוד.

המילון שעמד ברובד תחתון יותר הכיל מידע פונטי, תחבירי ומורפולוגי על המילים שאותן מייצגים הסמלים על הלוח. בנוסף, הוגדרו חוקים תחביריים בתבניות, ובמהלך בחירת הסמלים נמצאה התבנית המתאימה.

מספר (לא רב) של מערכות ליצירת הודעות, המבוססות על שיטות NLG, פותחו בעשור האחרון, ואת המשותף להן אפשר לתאר באופן הבא:

הקלט: רצף סמלים הנבחר מלוח סמלי בליס, makaton, טקסט טלגרפי

הפלט: משפט בשפה טבעית

השיטה:

1. איתור הפועל וחלקי דיבר אחרים ברצף, ניתוח האילוצים הלקסיקליים של כל אחד מהסמלים

(selectional restrictions, מספר הארגומנטים של הפועל)

2. שימוש בברירות מחדל או בסמלים נתונים לקביעת מספר, גוף, זמן, יידוע

3. יצירה מחדש של משפט

[pic]

איור 3 התהליך המשותף ליצירת שפה במערכות NLG-AAC

Compansion (Compression-Expansion) היא מערכת שפותחה על ידי [McCoy, 1997] במטרה לעזור לאנשים המשתמשים בשפה טלגרפית (אך גם למשתמשים בסמלים), והיא מרחיבה רצף של מילות תוכן לא מוטות למשפט מלא. המערכת תרחיב, למשל, את המשפט הטלגרפי John go store yesterday למשפט המלא John went to the store yesterday. ההרחבה נעשית בשני שלבים: ניתוח סמנטי ולאחריו יצירת המשפט מחדש. הניתוח הסמנטי מזהה קודם כל את המרכיבים העיקריים במשפט (צירופים שמניים אפשריים, למשל) ואת הפועל. במילון המלווה את המערכת מוגדרים המבנה הסמנטי האפשרי לכל אחד מהפעלים ואילוצי הבחירה selectional restriction של התפקידים הנצרכים של הפועל. למשל, לפועל eat יש agent שיש לו את התכונה "יצור חי", ולכן אם הקלט יהיה apple eat John המשפט שייווצר יהיה John eats an apple ולא The apple eats John. הניתוח הסמנטי מתבסס גם על נתונים הסתברותיים של צירופים שונים.

לאחר שהושלם הניתוח, המערכת משתמשת בתכנית היוצרת משפטים בשפה טבעית על פי חוקי דקדוק.

מערכות נוספות הן המערכת של [Karberis and Kouroupetroglou, 2002] שמתרגמת רצף סמלי בליס או Makaton ליוונית, והמערכת PVI (Intelligent Voice Prosthesis) [Vaillant, 1997] שמתרגמת רצף סמלי בליס לצרפתית.

יצירת משפטים בשיטה המבוססת על semantic authoring

המחקר שלנו מציג גישה חדשה ליצירת משפטים מלאים מרצף סמלים של לוחות תקשורת למשתמשי תת"ח, על ידי שימוש בשיטות מקובלות ביצירת שפות טבעיות ועל פי עקרון הלוחות הדינאמיים. המערכת מתוכננת ליצירת הודעות בעברית או באנגלית.

שיטת ההרחבה של טקסט טלגרפי, כפי שהוצגה בסעיף הקודם, היא השיטה בה השתמשו מערכות קודמות ששילבו טכניקות של יצירת שפות טבעיות בתת"ח. כדי לאפשר ניתוח טוב נדרשים משאבים המכילים ידע סמנטי-לקסיקלי רב, והמערכות יושמו עבור אוצר מילים קטן בלבד.

מלבד הקשיים הנובעים מניתוח טקסט טלגרפי, פירוש הנאמר מתבסס על ההקשר הפרגמאטי. שיחת פנים אל פנים מסתמכת על ההקשר המיידי בו נאמרים הדברים, ולכן יכול הדובר להשמיט פרטים כגון נושא הפועל, זמן הפעולה והתייחסות לדברים הנמצאים בסביבה הפיסית. הצורך בשחזור רמזים פרגמאטיים כגון אלה מקשה עוד יותר על הפירוש של הטקסט הטלגרפי.

השאלה העיקרית עליה ניסינו לענות הייתה האם ניתן ליצור משפטים מתוך רצף סמלים ללא צורך בניתוח ויצירה מחדש אלא בשיטה של תהליך מבוקר של כתיבה, שבו בכל צעד הסמלים המוצעים על המסך תלויים בהקשר של הסמלים שנבחרו עד כה, על פי קריטריונים תחביריים וסמנטיים.

בנוסף, בנינו מילון רב שימושי ורחב היקף שיכול להיות מוטמע בתוך המערכת ליצירת ההודעות, אולם הוא מתפקד גם כאפליקציה עצמאית. היבט מעשי היה לספק כלים של שפת בליס למשתמשים דוברי עברית. כשאומצה שפת הבליס לעברית, הוחלט שהכתיבה בבליס תיעשה כמו השפה העברית, מימין לשמאל, החלטה שהשפיעה גם על התצוגה של הסמלים, שחלקם הוצגו בכיוון ההפוך מהמקובל באנגלית או בשפות אחרות. תוצאת לוואי של החלטה זו הייתה, שעם התפתחות תוכנות לכתיבה ולשימוש בסמלי בליס ברחבי העולם, הן לא התאימו למשתמש דובר העברית.

אופן יצירת הטקסט מסמלים

רעיון התשתית בשיטה הזו הנו כתיבה סמנטית של מושגים ומבנים לוגיים, והוא מבוסס על SAUT ( [Biller 2005][Biller et al. 2005]), מערכת לכתיבה לוגית המקודדת בעזרת conceptual graphs (CG). המערכת שייכת למשפחת WYSIMYM (What You See Is What You Mean) ליצירה אוטומטית של טקסט. במערכות אינטראקטיביות אלה מכניס המשתמש תוכן בצורת מבנים לוגים, והמימוש המתאים מוצג במקביל בשפה טבעית אחת או יותר. המערכת משמרת מודל של השיח ושומרת את ההקשר של המסמכים הנכתבים – שיטה המאפשרת יצירת ביטויי התייחסות, כגון שימוש בכינויי גוף.

[pic]

איור 4 דוגמה למתן אפשרויות בהינתן רצף חלקי למשפט

בכל שלב של כתיבת מסר מוצגים על המסך סמלים הקשורים לסמלים שנבחרו קודם לכן. למשל, אם הסמל הקודם שנבחר מתייחס לפועל הדורש מושא שהוא כלי instrumental theme)), יוצגו על המסך רק סמלים שיכולים לשמש ככלים. ברירות מחדל על השיח, כמו ההקשר הכללי של כל מבע או של שיחה, נקבעות מראש על ידי המשתמש, ומבחר הסמלים המוצג מצטמצם בהתאם. בשיטה זו, כל שלב בהכנסת קלט מבוקר על ידי אוסף חוקים המבוססים על האונטולוגיה. יצירת ההודעה היא תהליך אינקרמנטלי, כשכל בחירה של סמל מובנה בייצוג פנימי של משפט שמועבר לתכנית הדקדוק ומדפיס אל המסך את המשפט החלקי. עם סיום בניית המשפט (על ידי לחיצה על מקש מתאים), מוצג המשפט המלא. אם חסר מידע בייצוג הפנימי, אזי הוא מושלם על ידי ערכים הנקבעים כברירות מחדל. המערכת גם שומרת הקשר של שיח על ידי ניהול פנימי של ביטויי התייחסות, הן לגבי ישויות (שעל פי רוב ממומשות בשפה בעזרת שמות עצם) והן לגבי משפטים שלמים (המתארים פעולות או יחסים).

על פי הפרדיגמה של הגב' גייל פורטר בבניית לוחות דינאמיים, במערכת ה-Dynavox ©, המערכת מציעה גם התחלות משפטים, sentence starters, כגון I'm going to... I want to…. משפטים כאלה מיוצגים באופן פנימי כמבנים חלקיים של ייצוג המשפט ומשתלבים בשיטת הכתיבה הסמנטית.

שיטה זו משלבת שלוש גישות בתכנון לוח תקשורת מבוסס NLG:

• כתיבה סמנטית מאפשרת מימוש הודעות בשפה טבעית ומאפשרת מבנים גמישים של הודעות.

• המסך של לוח התקשורת מתעדכן בכל שלב ביצירת ההודעה.

• קלטים מוכנים מראש לייצוג משפטים או חלקי משפטים בשפה טבעיות משמשים כתבניות סמנטיות.

האצת מהירות התקשורת נוצרת בעקבות הצגת מבחר סמלים ממוקד יותר על המסך (על פי ההקשר), סיפוק אוטומטי של ברירות מחדל (למשל גוף הדובר, מספר, נושא במשפט) והוספה אוטומטית של מילות יחס והטיות.

מבנה המערכת

המערכת מבוססת על מספר כלים המשולבים יחד ליישום התת"ח:

1. לקסיקונים (מילון בליס, מילון פעלים ש"מתרגם" מבנה סמנטי למבנה תחבירי)

2. אונטולוגיה – בסיס נתונים של מושגים ויחסים והקשרים ביניהם

3. דקדוקים ליצירת שפות טבעיות SURGE/HUGG

4. כתיבה סמנטית ממבנים לוגיים SAUT- Semantic AUthoring Tool

[pic]

איור 5 סכימה של ארכיטקטורת המערכת

המקורות הלקסיקליים והאונטולוגיה

תהליך יצירת טקסט, הן מטקסט טלגרפי והן בשיטת הכתיבה הסמנטית, מבוסס בצורה משמעותית על יעד לקסיקלי, המקודד במערכת שלנו בשלושה מודולים שונים (כפי שניתן לראות באיור (5:

1. מילון סמלי בליס (עליו יפורט בהמשך)

2. אונטולוגיה ובוחר לקסיקלי lexical choose

3. מילון רחב היקף לפעלים באנגלית, המיועד ליצירת שפות טבעיות [Jing et al., 2000]

הן האונטולוגיה והן מילון הפעלים מבוססים בחלק גדול על לקסיקון ממוחשב לאנגלית WordNet [Miller et al., 1990] – שבו המילים ממוינות ל-SynSets – קבוצות שקילות של מילים נרדפות synonyms. בין קבוצות המילים הנרדפות מוגדרים קשרים לקסיקליים שונים כגון metonyms, antonyms, hyponyms, hypernyms.

האונטולוגיה כוללת מידע הלקוח מ-VerbNet [Kipper et al., 2000], לקסיקון לפעלים באנגלית המכיל מידע על selectional restrictions, ומסווג את הפעלים על פי החלוקה של בת' לוין [Levin, 1993]. על פי הסיווג של לוין נבנה גם המילון של הפעלים ליצירת שפה טבעית.

[pic]

איור 6 מימין, דוגמה למידע ב-WordNet עבור המילה girlומשמאל המידע ב-VerbNet עבור הפועל eat.

דקדוק ליצירת שפה טבעית

דקדוק ליצירת שפה טבעית (הנקרא גם מממש תחבירי (syntactic realizer הנו המודול האחרון בתהליך היצירה האוטומטית של שפה במערכת ליצירת שפות טבעיות. הדקדוק אחראי לסדר את המילים כפי שיופיעו במשפט, אחראי להוסיף מילות יחס וסימנים תחביריים אחרים, כגון הטיות מורפולוגיות, ותפקידו הוא למפות "מטרות תקשורת" המיוצגות במבנה פנימי (סמנטי) למבעים מתאימים בשפה טבעית.

הקלט למממש התחבירי הוא ייצוג מופשט של משפט או צירוף ללא מידע תחבירי, כגון תפקידים (נושא, נשוא, מושא). הדקדוק מבצע את הבחירה של מבנה תחבירי על פי המבנה הסמנטיThematic Roles של סוג הפועל. הדקדוק מחשב את המשפט הרצוי על פי אילוצים נתונים או על פי ברירות מחדל - למשל: פעיל או סביל, משפט שאלה, חיווי או ציווי.

הדקדוק SURGE פותח לשפה האנגלית, והדקדוק HUGG פותח לשפה העברית לפי אותו מודל, במטרה לאפשר ייצוג אחיד של קלט, שאינו תלוי שפה (מלבד הפריטים הלקסיקליים), ושיאפשר יצירת משפט הן בעברית והן באנגלית.

מילון סמלי בליס

במסגרת העבודה, לקסיקון בליס מומש לעברית ולאנגלית,[2] ומכיל היום כ-2,300 סמלים. ניתן להשתמש בו כמילון עצמאי למטרות עיון או כחלק מיישום. עיצוב המילון מנצל את התכונות הייחודיות של שפת הבליס. מבחינה טכנית, צויר רק אוסף קטן של צורות אטומיות, ואילו שאר הסמלים נוצרים אוטומטית מתוך הנתונים הקיימים על הסמל בבסיס הנתונים על היחסים שלו עם סמלים אחרים. חיפושים בלקסיקון אפשר לעשות בצורה הרגילה (טקסטואלית), על פי שם הסמל או המילה (למשל המילה "אוכל"), אך ניתן לעשות חיפושים מורכבים יותר, כמו מציאת כל הסמלים המכילים סמל אחר או כל הסמלים המכילים צורה מסוימת (כגון "מציאת כל הסמלים המכילים את הסמל אוכל").

הלקסיקון תוכנן כך שאפשר יהיה לערוך סמלים, להוסיף, למחוק או ליצור סמלים חדשים בצורה נוחה וקלה (למשל על ידי שילוב של סמלים קיימים). הלקסיקון מתאים הן לעברית והן לאנגלית, למרות הייצוג השונה הקיים בשתי השפות (איור (7.

המילון מבוסס על בסיס נתונים הכולל את כל הסמלים בלקסיקון בליס-עברית [Shalit et al., 1992] וניתן לעדכנו במהירות. בסיס הנתונים מאורגן בטורים על פי מבנה הסמל. סוגי המבנה הם: Atom(למשל הסמל לחשמל באיור למטה) Superimposed (למשל בסמל אנרגיה), או Sequence (הסמל לבית ספר באיור למטה).

המילון זמין בגרסה מקוונת בכתובת .

[pic]

איור 7מימין: מסך לדוגמה במילון המקוון. משמאל: הבדלים בייצוג סמל בליס בעברית ובאנגלית

לוח סמלי בליס

שלושה אספקטים נלקחו בחשבון בתכנון מערכת לוח התקשורת למטרות תת"ח:

שפת הקלט – סמלי בליס

הסמלים המוצגים על המסך וסידורם – כפי שיתואר להלן

תהליך העיבוד ליצירת ההודעה (כפי שהוסבר לעיל)

הסמלים המוצגים על המסך במצב התחלתי נבחרים על פי כמה שיטות אפשריות: הסמלים שבשימוש הנפוץ ביותר, סידור מסכים על פי קטגוריות, סידור על פי יחסים פרדיגמאטיים (סמלים אפשריים בהקשר הנוכחי) או סידור הסמלים על פי יחסים סינטגמטיים (כלומר על פי ההקשר התחבירי). השימוש בתכונות הייחודיות של בליס מאפשר הצגה של כל הסמלים שקשורים לסמל מייצג שנבחר. למשל, אם נבחר הסמל money, יוצגו על המסך הסמליםbank business cheap clerk coin convenience-store expensive fee poor price prostitution rich shekel store to-buy to-earn to-finance to-pay to-sell wallet.

אתחול שיחה יכול להתבצע על ידי קביעת ערכי ברירת מחדל, כמו שם הדובר, רשימת הנוכחים, זמן, מקום. בנוסף, אפשר לקבוע את ההקשר של השיחה (בבית הספר, בחנות, בבית).

על המסך מופיעים כמה סוגים של מידע:

1. רשימת המשתתפים וברירות מחדל אחרות

2. כפתורי פונקציה (כגון מחיקה, סיום משפט, דפדוף)

3. כפתורי סמלים

4. אזור לטקסט שנוצר

[pic]

איור 8 סכמה של לוח התקשורת

במהלך היצירה והשיח מתבצעים שינויים כגון יצירת ביטויי התייחסות Referential expression:

Pablo and I ( WE וגם צירוף של משפטים כגון We are playing and watching Television

סיכום

במאמר זה הצגנו סקירה על שימוש מקיף בשיטות NLP למטרת AAC, ובאופן מפורט יותר התייחסנו למערכות תת"ח המבוססות על שיטות ביצירת שפות טבעיות.

העבודה המקורית המוצגת במאמר מתייחסת לשיטה חדשה ליצירת הודעות בשפה טבעית על ידי תהליך של כתיבה סמנטית, שלא דורש ניתוח והבנה של מסר טלגרפי.

הצגנו את מקורות המידע השונים הנדרשים למימוש תהליך כזה, כגון מילונים, מממש תחבירי, לקסיקונים, אלגוריתמים לתכנון ביטויי התייחסות וקיבוץ משפטים, וכן הצגנו את ממשק המשתמש – לוח תקשורת, הפועל באופן דינאמי ומשנה את התצוגה על פי ההקשר.

המערכת עדיין לא נוסתה על משתמשי תת"ח אלא רק על משתמשים בלי נכויות מוטוריות, שפתיות או קוגניטיביות במערכת טקסטואלית. הניסוי הראה שניתן לרכוש את שיטת הכתיבה הסמנטית בזמן קצר יחסית וניתן לבטא באמצעותה אחוז גדול של המשפטים הנדרשים. עם מימוש ממשק שיותאם למשתמשי תת"ח נוכל לבדוק בצורה טובה יותר את ענייני הגברת המהירות, הנוחיות והעומס הקוגניטיבי על המשתמש.

במסגרת העבודה בעתיד אנו מתכננים לטפל בהתאמת פלט קולי, התאמה לאמצעי סריקה שונים, התאמה לפי משתמש (על ידי שיטות למידה אוטומטית של אוצר המילים ותת-השפה שבה משתמשים) ובנוסף לשלב את המערכת עם שיטות שליפה אחרות.

ביבליוגרפיה

[Biller, 2005] Biller, O. (2005). Semantic authoring for multilingual text generation. Master's thesis,

Department of Computer Science, Ben Gurion University, Israel.

[Biller et al., 2005] Biller, O., Elhadad, M., and Netzer, Y. (2005). Interactive authoring of logical

forms for multilingual generation. In Proceedings of the 10th European Workshop on Natural Language Generation, Aberdeen, Scotland.

[Carroll et al., 1998] Carroll, J., Minnen, G., Canning, Y., Devlin, S., and Tait, J. (1998). Practical

simplification of English newspaper text to assist aphasic readers. In AAAI-98 Workshop on Integrating Artificial Intelligence and Assistive Technology, Madison, Wisconsin. preliminary research report.

[Dahan-Netzer, 1997] Dahan-Netzer, Y. (1997). Design and evaluation of a functional input specification language for the generation of bilingual nominal expressions (Hebrew/English). Master's thesis, Department of Computer Science, Ben Gurion University, Beer-Sheva Israel. (in Hebrew).

[Elhadad and Robin, 1996] Elhadad, M. and Robin, J. (1996). An overview of SURGE: a re-usable

comprehensive syntactic realization component. In Proceedings of INLG'96, Brighton, UK. (demon-

stration session).

[Garay-Vitoria and Abascal, 1997] Garay-Vitoria, N. and Abascal, J. G. (1997). Word prediction for

inflected languages. application to Basque language. In Proceedings of the ACL workshop on Natural

Language Processing for Communication Aids, Madrid

[Gatti and Matteucci, 2005] Gatti, N. and Matteucci, M. (2005). CABA2L a Bliss predictive composition assistant for AAC communication software. In Seruca, I. and Filipe, J., editors, Enterprise

Information Systems VI. Kluwer Publisher, Amsterdam, The Netherlands.

[Hunnicutt, 1986] Hunnicutt, S. (1986). Bliss symbol-to-speech conversion: Blisstalk. Journal of the

American Voice I/O Society, 3:19-38.

[Jing et al., 2000] Jing, H., Dahan-Netzer, Y., Elhadad, M., and McKeown, K. (2000). Integrating

a large-scale, reusable lexicon with a natural language generator. In Proceedings of the 1st INLG

conference, pages 209{216, Mitzpe Ramon, Israel.

[Karberis and Kouroupetroglou, 2002] Karberis, G. and Kouroupetroglou, G. (2002). Transforming

spontaneous telegraphic language to well-formed Greek sentences for alternative and augmentative

communication. In SETN '02: Proceedings of the Second Hellenic Conference on AI, pages 155-166,

London, UK. Springer-Verlag.

[Kipper et al., 2000] Kipper, K., Dang, H. T., and Palmer, M. (2000). Class-based construction of a

verb lexicon. In Proceeding of AAAI-2000.

[Levin, 1993] Levin, B. (1993). English Verb Classes and Alternations: A preliminary Investigation.

University of Chicago Press, Chicago Illinois.

[Liben-Nowell, 2000] Liben-Nowell, D. (2000). Text Simplification. PhD thesis, MPhil, Computer

Speech and Language Processing, University of Cambridge, Churchill College.

[McCoy, 1997] McCoy, K. F. (1997). Simple NLP techniques for expanding telegraphic sentences. In

Proceedings of workshop on NLP for Communication Aids, Madrid. ACL/EACL.

[Miller et al., 1990] Miller, G., Beckwith, R., Fellbaum, C., Gross, D., and Miller, K. (1990). Introduc-

tion to WordNet: an on-line lexical database. International Journal of Lexicography (special issue),

3(4):235-312.

[Moulton et al., 1999] Moulton, B. J., Lesher, G. W., and Higginbotham, D. J. (1999). A system for

automatic abbreviation expansion. In Proceedings of the RESNA '99 Annual Conference, pages

55-57, Arlington, VA. RESNA Press.

[Shalit et al., 1992] Shalit, A., Wine, J., and Yaniv, K. (1992). Hebrew Blissymbols Lexicon. ISAAC-

Israel.

[Shieber and Baker, 2003] Shieber, S. M. and Baker, E. (2003). Abbreviated text input. In IUI'03,

Miami, Florida, USA.

[Vaillant, 1997] Vaillant, P. (1997). A semantic-based communication system for dysphasic subjects. In Proceedings of the 6th conference on Artificial Intelligence in Medicine Europe (AIME'97), Grenoble, France.

[Vanderheyden et al., 1996] Vanderheyden, P., Damesco, P., and McCoy, K. (1996). A preliminary

study into schema-based access and organization of reusable text in AAC. In Langton, A., editor,

Proceedings of the RESNA '96 Annual Conference, Salt Lake City, UT.

[Waller and Jack, 2002] Waller, A. and Jack, K. (2002). A predictive Blissymbolic to English translation system. In Proceedings of ASSETS 2002, pages 186-191, Edinburgh, Scotland.

[Waller et al., 2000b] Waller, A., O'mara, D., Tait, L., Hood, H., Booth, L., and Brophy-Arnott,

B. (2000b). Integrating a story-based aid within curriculum. AAC 2000 Practical Approaches to

Augmentative and Alternative Communication.

[pic][pic][pic]

-----------------------

[1] 35th Annual Meeting of the Association for Computational Linguistics and 8th Conference of the European Chapter of the Association for Computational Linguistics

[2] מומש כפרויקט לתואר ראשון על ידי הסטודנט יואב גולדברג, המחלקה למדעי המחשב, אוניברסיטת בן גוריון.

-----------------------

נניח שהטקסט שהודפס עד כה הוא:

I play b

המערכת תציע את המילים הבאות:

be born ball baseball brand

אם התו הבא שמוקלד הוא a, אזי המערכת תצמצם את מבחר המילים

ball baseball basketball baglama balalaika

פישוט תחבירי

A former ceremonial officer from Derby, who was at the heart of Whitehall's patronage machinery, says there is a general review of the state of the honours list every five years or so.

(

A former ceremonial officer from Derby was at the heart of Whitehall's patronage machinery.

This former officer says there is a general review of the state of the honours list every five years or so.

פישוט לקסיקלי

“I was quaffing amber brew at a drinking establishment”

(

“I was drinking beer at a pub”.

קלט ותכנון תוכן

lexicalization

Syntactic realization

Pablo and I are playing

ניתוח הקשרים בין הסמלים

[pic]

[pic]

[pic]

[pic]

................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download