כתב אורח – עופרי בן פורת
לפני שנתחיל להבין בינה מלאכותית Ai, אנחנו צריכים ללמוד על “הקצה” ( The edge). הרבה אנשים מעולם לא שמעו על הקצה, אבל בעולמות הבינה המלאכותית, זה די דומה לסיפור הביצה והתרנגולת. במילים אחרות, אי אפשר ללמוד על אחד מבלי ללמוד על השני. לשם הבהרה, אותו ״קצה״ שאנחנו מדברים עליו, נוגע גם למכשיר שבאמצעותו אתם קוראים כתבה זו.
לצורך ההדגמה, הסתכלו על הסמארטפון שאתם מחזיקים ביד, על מכשירי ה- IoT שבמטבח שלכם, על הקופה בשירות עצמי בסופר ליד הבית שלכם, ואולי אפילו על המכונית המשפחתית בחנייה שלכם, כולם מחוברים לחוות שרתים מרכזית, וכולם נמצאים שם – על אותו “קצה”. בינה מאכותית יכולה להיות חכמה ושימושית רק כאשר יש לה קיום בעולם האמיתי.
הדלק האמיתי: דאטה
באותו האופן שידע מזין אינטליגנציה, נשמת החיים של בינה מלאכותית היא הנתונים שנקצרים “בקצה”, בעולם האמיתי. דרך כמות ואיכות הנתונים מהם מורכבת הדאטה ניתן ללמוד על הדיוק של הבינה המלאכותית. הבעיה היא שמדובר על כמויות עצומות וגדולות של דאטה מכדי להיות מועברות במלואן “מהקצה” לנקודות המרכזיות (חוות השרתים המהוות את תשתיות הענן), שבהן ניתן לעבד את הדאטה עד לרמת דיוק גבוהה שמאפשרת למידה.
לטסלה, למשל, לוקח 10 שעות להעלות נתונים של שעת נסיעה אחת בלבד, ממכונית אחת. אפשר להניח כי החברה משתמשת בשבריר מכל הנתונים שנאספים על ידי ציי הרכבים שלה – ארבעה גלגלים המהווים במקרה הזה את ״מכשירי הקצה״.
וזהו מה שמכנים צוואר בקבוק. אנדי ג’סי, מנכ”ל AWS (Amazon Web Services) מעריך כי שימוש באמצעים רגילים יאפשר להעביר אקסה-בייט (מיליארד גיגה בייט) לענן לאחר 26 שנים. לצורך העניין, חברות גדולות כמו וולמארט מייצרות משהו כמו שני אקסה-בייט בחודש אחד. אם כך, אין זה פלא ש- AWS בוחרת לשנע את אל לקוחותיה הגדולים כרטיסי זיכרון ענקיים על גבי משאיות ואופנועי שלג.
אז כן, כבישים ודלק הם הדרך המהירה ביותר כיום להעביר את כמויות הנתונים המסיביות שמניעות את מהפכת הבינה המלאכותית. ואם אמרנו שדאטה היא הדרך הטובה ביותר להזין בינה מלאכותית, הרי שאנחנו מתבוננים פה על דיאטת כאסח.
תיוג
יש עוד תחום גדול בשרשרת האספקה של בינה מלאכותית: תיוג. הרבה מהתועלת של בינה מלאכותית נשענת על היכולת של המכונות לזהות את האובייקטים והמצבים בסביבתם. חשוב להבין שהשטח משתנה, ורוב האובייקטים, אפילו מאותה הקטגוריה – אינם זהים. לדוגמה, קופות אוטומטיות בסופרמרקטים צריכות להיות מסוגלות לזהות סוג אחד של תפוחים מאחר. שהרי העלויות של תפוח חרמון אינן זהות לעלות של תפוח מסוג פינק ליידי. אם מצלמות הקופה העצמית אינן מזהות את ההבדל, לאורך זמן, ייווצר הפסד כספי לא קטן לסופרמרקט. הבעיה נעוצה בעובדה שהאלגוריתמים שעומדים בבסיס הטכנולוגיה הם תמימים כתינוקות שזה עתה נולדו. יש להזין אותם במיליוני דוגמאות מתויגות שנועדו ללמד אותם “לראות”. אז איך מתייגים כמויות עצומות של תמונות גולמיות? התשובה היא על ידי בני אדם.
מודיעין לא נולד מעצמו. הוא צריך להתחיל עם המוח האנושי, ומאות אלפים ממנו מועסקים במוקדים משרדיים שהוקמו למשימה זו בדיוק. בכדי שאלגוריתם של מכונית אוטונומית ילמד את המשמעות של תמרורים או על ההבדל בין ילד לכלב, צריך לצפות בצילומים במשך שעות ולתייג חפצים פריים אחרי פריים.
תיוג על הקצה
לקוחות הסופרמרקט יכולים לעשות את מלאכת התיוג בעצמם, על ידי אישור זהות הפרי או הירק במסך המגע שבקופה העצמית. האלגוריתמים של המכונה נשענים על הזיהוי הקולקטיבי של הקונים, עד שהם לומדים לעשות זאת בעצמם. אפשר להאיץ את התהליך הרחק מהחנות. לאחרונה שלחנו כמה מכונות לקופה עצמית, ושכרנו צוות אנשים שיסרוק מגוון של 30 פירות וירקות שתויגו בכל פעם. תוך שלושה שבועות בלבד דיוק הקופה עבר מ- 60% ל- 99.8%.
עם זאת העבודה הכרוכה בתיוג מהדקת עוד יותר את צוואר הבקבוק. דו”ח מקנזי משנת 2018 הציג את זה כמכשול הגדול ביותר בתעשיית הבינה המלאכותית. מסיבה זו בדיוק בעתיד מכונות יצטרכו ללמד את עצמן, תוך ביטול הצורך בתיוג והעברת המידע לענן. דאטה על מכשירי הקצה הופכת במהרה לדרך היחידה להריץ ולהכשיר מודלים של בינה מלאכותית, עלינו רק להבטיח כי הלמידה נעשית טוב ונכון מההתחלה.
הכותב הוא מנכ”ל ושותף–מייסד של חברת הסטארטאפ Edgify