אחד התחומים החמים בעולם הטכנולוגיה, שעשה קפיצת מדרגה בשנים האחרונות הוא ניתוח ועיבוד תמונה על בסיס בינה מלאכותית. במובן מסוים, חלק מהפתרונות הקיימים היום הם בגדר פתרונות קוֹמוֹדִיטִי – קרי, ניתן לקנות/להשתמש במוצרי מדף והביצועים יהיו מצוינים. דוגמה מצוינת היא אפליקציית התמונות של גוגל, שבין השאר מתייגת אנשים בצורה אוטומטית. לא פעם ולא פעמיים האלגוריתם מצליח במקומות בהם אדם נורמטיבי נכשל בזיהוי ותיוג.
בשנים האחרונות חלה התפתחות נוספת ומשמעותית בתחום הבינה המלאכותית והיא משמשת לא רק כאמצעי לקבלת תובנות, שמסייעות באוטומציה, באופטימיזציה ובקבלת החלטות, אלא גם כאמצעי לייצור של תוכן יש מאין — בינה מלאכותית ג׳נרטיבית, שמחוללת תמונות, טקסטים, לחנים, דימויים ואפילו מחזות ותסריטים.
אחד הנושאים היותר מורכבים בתחום הוא ניתוח והבנת טקסט או שמע: Natural Language Processing (NLP) — או בעברית, עיבוד שפה טבעית. מדובר בתחום שבו משתמשים בבינה מלאכותית כדי ללמד מחשב ״להבין״ דברים שנאמרים או נכתבים בשפות אנושיות. בעוד בני האדם יודעים, כבר בגיל מוקדם מאוד, לפענח שמע וקריאה בצורה אוטומטית, ולבנות את ההקשרים בין המילים על מנת לתקשר, הרי שלמחשב זה הרבה יותר מורכב. הכוונה היא לא לזיהוי של מילה ספציפית ומשמעות בדומה למילון, אלא להבנה של ההקשר ביחס למשפט, פסקה, מסמך וכו׳.
אם ניקח לדוגמא את המילה ״לילך״, הפרשנות תשתנה בהתאם לתוכן: לילך יכול להיות סוג של צמח, שם של אדם או שם של מקום. מה שמדהים במוח האנושי הוא היכולת לנתח את כל הנתונים תוך כדי שמיעה או קריאה ולבצע את כל ההקשרים הנדרשים על מנת להבין את משמעות המילה בהקשר של התוכן. זו הסיבה שמילה בודדת בתוך משפט היא בדרך כלל חסרת משמעות להבנת התוכן וזו גם אחת הסיבות למורכבות של לימוד מחשב בתחום ה-NLP.
ChatGPT שבנתה OpenAI עושה שימוש באלגוריתמים מורכבים של עיבוד שפה טבעית ומבוסס על מודל שפה אחר של החברה – GPT 4 – הפך במהרה ללהיט. משתמשים רבים מזינים ל-ChatGPT בקשות שונות ומשונות ובתמורה המודל מפיק תובנות, שמבוססות על המידע הרב ברשת עשליו הוא אמון. יש לא מעט מנועים של NLP, אבל הייחודיות של הכלי הזה היא הוורסטיליות הרבה ודיוק האלגוריתמים.
עם זאת, הכלי עדיין לא מושלם ומייצר לא מעט טעויות, בעיקר בנושאים מדעיים. ניתן למצוא בו בקלות פרטים לא נכונים והקשרים לוגיים כושלים. כמו כן, המידע שהוזן למערכת מתייחס רק עד לשנת 2021 (בגרסאות הבאות האלגוריתם יתעדכן באופן אקטיבי). אם נבקש ממנו מאמר על ״תעשיית ההייטק בשנת 2022 בצל האינפלציה והמלחמה המתמשכת באוקראינה״, הוא כנראה יתקשה להיות מדויק. מה שכן, הוא עדיין הרבה יותר מדויק ממודל לימוד השפה של מטא, גלקטיקה, שהדמו שלו הוסר מהרשת יומיים לאחר שנחשף.
כדי לייצר פתרון NLP איכותי נדרש בראש ובראשונה לארגן את הכמות האדירה של המידע שקיים ברשת, לנקות, לתייג, ולהתחיל לאמן את המחשב עוד ועוד על מנת לדייק את האלגוריתמים. מדובר בתהליך ארוך ויקר, אך בלעדיו התוצאות יהיו לא טובות, בלשון המעטה.
נשאלת השאלה, אפוא, האם בקרוב נראה גם מנועי NLP אמינים בעברית. כיום, גם בשפת הקודש יש מספר מנועים וכלים בתחומי ה-NLP, אבל הם רחוקים מאוד מהיכולות הקיימות באנגלית, בספרדית ובערבית, למשל. מי שיתנסה עם הכלי של ChatGPT בעברית, יקבל תוצרים, אבל הם לא יהיו באותה רמה כמו הטקסטים באנגלית, ויש עדיין פער גדול בניתוח עמוק וביכולת הסקת מסקנות. יש מספר סיבות לכך, אבל הסיבות העיקריות הן מורכבות השפה העברית, כמות הדאטה בעברית וכמובן, כמות המשאבים שמושקעים ב-NLP בעברית.
פיתוח הכלי הזה בארץ דורש תקציבים ותמיכה. בחו״ל היינו עדים לאחרונה לגל של חברות שמשתמשות בבינה מלאכותית ג׳נרטיבית שהודיעו על סבבי גיוס הון גדולים. כפי שדווח לאחרונה במאגר קראנץ׳ בייס, חברת Stability AI הפכה ליוניקורן לאחר שגייסה 101 מיליון דולר. חברת Jasper הכריזה על גיוס של 125 מיליון דולר. קרן הסטארט-אפים של OpenAI הובילה השקעה של 50 מיליון דולר בחברת Descript, שפיתחה פלטפורמה מבוססת בינה מלאכותית לעריכת וידאו ואודיו. אפילו גוגל נכנסה לפעולה ועל פי הדיווחים היא במגעים להשקיע לפחות 200 מיליון דולר בסטארט-אפ הבינה המלאכותית Cohere.
בשנה האחרונה אנחנו רואים יותר ויותר חברות ישראליות שנדרשות לנושא. הקפיצה התרחשה לא מעט בזכות מכרז נימבוס – מכרז להקמת דאטה סנטר והנגשת השירותים בישראל על ידי חברות הענק בתחום. המכרז מאפשר לגופים ממשלתיים ואחרים להעביר, החל מהשנה, את הדאטה והכלים שלהם לענן הציבורי בישראל ובכך לוודא שהמידע יאוחסן וינותח בגבולות המדינה.
בנוסף, בסוף 2020, משרד הדיגיטל הלאומי בשיתוף רשות החדשנות, אישרו את הקמתו של איגוד חברות לטכנולוגיות שפת אנוש (NLP), שיסייע בקידום הבנת השפה העברית והשפה הערבית במערכות ממוחשבות בתקציב של כ-7.5 מיליון שקל למשך שלוש שנים.
אין ספק: טכנלוגיה מתאימה ובשלה בתחום תשנה את שוק התעסוקה והמשרות בעולם, תאפשר אטומיזציה מלאה במאות אלפי תהלכים ידניים, בוטים חכמים, הקלדות שמע, שירות לקוחות ועוד. היכולות שאנחנו רואים כיום בשוק העולמי גורמים למשתמשים ולעוסקים בתחום להאמין שהשמיים הם בעצם לא הגבול וייתכן שבשנים הקרובות נצליח לפצח גם כלי אמין של עיבוד שפה טבעית בעברית. בינתיים, המאמר הזה נכתב ללא עזרתה של בינה מלאכותית.