מתן תורה דיגיטלי – בואו לתקן את הגניזה הקהירית - סרוגים

מתן תורה דיגיטלי – בואו לתקן את הגניזה הקהירית

פרויקט חכמת המונים מבקש מהציבור המלומד לסייע בהעלאת כתבי היד של הגניזה הקהירית לקבצים דיגיטליים. את רוב העבודה עושה מחשב, אבל אתם נדרשים לתקן את השגיאות שלו. כל הפרטים

מתן תורה דיגיטלי – בואו לתקן את הגניזה הקהירית
  כתב יד של הגדה של פסח מתוך ספריית אוניברסיטת חיפה

פרויקט "סופרי הגניזה הקהירית"

הגניזה הקהירית היא אחד מן האוספים המדהימים ביותר שנמצאו אי פעם. מאות אלפי קטעים שנגנזו בגניזה שבבית הכנסת בקהיר מתעדים באופן מדהים את תורת עם ישראל ותרבותו. במשך מאות שנים גנזו יהודי מצרים בעלייה שבבית הכנסת לא רק ספרי תורה וכתבי קודש, אלא גם כל דבר הכתוב באות עברית, ולפעמים אפילו מסמכים בערבית.

כך הגיעו לגניזה ספרי קודש רבים בכל תחום אפשרי: תנ"ך, פרשנות תנך, משנה, תלמוד, אגדה, קבלה, מדרש, פיוט, פילוסופיה יהודית. וגם תעודות המלמדות על חיי היום יום: כתובות, שטרות, חוזים, מכתבים אישיים – כולל של גדולי ישראל כגון רבי יוסף קארו והרמב"ם (מן הרמב"ם ניתן למצוא בגניזה גם טיוטות בכתב ידו של ספריו, משנה תורה מורה נבוכים ועוד, גם את מכתביו האישיים, ואפילו מרשמים של תרופות שכתב בתור רופא).

פרויקט "סופרי הגניזה הקהירית" מבוצע בשיתוף פעולה בינלאומי נרחב עם אוניברסיטאות פרינסטון, פנסלבניה ומעבדות זוניברס לחכמת המונים באוקספורד. בעקבות פרויקט פרידברג שהביא את כל תצלומי הגניזה הקהירית לאינטנרנט, בא הפרויקט הזה ומבקש את עזרת הציבור בהעתקת קטעי גניזה. באתר מיוחד שנבנה לשם כך, יכולים משתתפים מכל רחבי העולם לסווג קטעי גניזה, לתעתק קטעי גניזה בעברית ובערבית, ואף לדון בהם בפורום מיוחד.

פרויקט "תיקון סופרים", משותף למעבדת אליהו בחוג לתולדות ישראל, החוג למערכות מידע באוניברסיטת חיפה ולמכון EPHE-PSL  פריז נועד להנגשת כתבי יד יהודיים עתיקים, ולספריה הלאומית בירושלים. המטרה הסופית: להנגיש למעלה מ-10 מיליון טקסטים יהודיים מכל התקופות לחוקרים ולציבור הרחב. "המטרה היא לשלב בין טכנולוגיה מתקדמת שמסוגלת לקרוא לבדה את הטקסטים לבין חוכמת ההמונים, או נכון יותר, סקרנות ההמונים, שתדע לתקן את הבניה המלאכותית במקומות שבו היא טועה. בסופו של תהליך, ידע יהודי שהיה חבוי – בוודאי שמעיני הציבור אבל גם ממרבית החוקרים – יהיה זמין, גלוי ופומבי", אמר ד"ר משה לביא, ממעבדת אליהו ואחד מראשי הפרויקט.

נכון להיום, בספריות והארכיונים ברחבי העולם יש מיליוני עמודי טקסטים עבריים קדומים. לאור הכמות העצומה ושיטות המחקר הקיימות, רובם לא ייחשפו מעולם לעיני החוקרים. בשנים האחרונות ישנם פרויקטים רחבי היקף של דיגיטציה של המסמכים והעלתם לרשת, כך למשל, הספרייה הלאומית מעלה בהדרגה צילומים באיכות גבוהה של כעשרה מיליון טקסטים הנמצאים ברשותה, או נתקבלו מספריות אחרות. אלא שגם לאחר שהטקסטים יעלו לרשת, מספרם יהיה עצום מידי לכמות המצומצמת יחסית של חוקרים. המשמעות היא שאוצר בלום של ידע ומסורות יהודיות יאבדו.

המחשב לא כזה חכם

הפרויקט מבקש לרתום את תחום חדשני, מדעי הרוח הדיגיטליים, לעזרה. הפרויקט מבוצע בשילוב עם מכון EPHE שבצרפת, שם מבוצעים פרויקטים נוספים של הנגשת ספרות תלמודית, כגון מהדורה דיגיטלית של המשנה, ושם  פותחו כלי בינה מלאכותית מתקדמת לקריאה אוטומטית של כתבי יד KRAKEN שמה. ה-KRAKEN קיבלה כמשימה ראשונה לקרוא את כ-600 העמודים של "כתב יד ג'נבה" ממדרשי תנחומא, שנכתב במאה ה-13, והם מדרשי אגדה על חמשת חומשי תורה.

למרות היכולות הגבוהות של ה-KRAKEN, הוא עדיין לוקה בחסר חשוב: היגיון בריא. כך, המשפט "הפה ביקש לעסוק" הופך ל"הפה ביקש לעשן" "ותמהר כדה אל השוקת" הופך ל"תמהר כדה אל השוקו" ואפילו "ישוב ה' לשוש" הופך, רחמנא ליצלן, ל"ישו ה' לשוש". "זה המקום שבו אנחנו פונים לציבור. הציבור לא רק מתקן את הטעויות של התוכנה, אלא מכיוון שמדובר בתוכנה לומדת, הוא גם משפר אותה כל הזמן.

זהו השילוב במעבדת אליהו שאנו מבקשים ליצור בין טכנולוגיה, רוח ושיתוף הציבור", אמר פרופ' צביקה קופליק מהחוג למערכות מידע באוניברסיטת חיפה, ראש שותף של התוכנית למדעי הרוח הדיגיטליים. לאט ובהדרגה יתווספו למערכת עוד כתבי יד ועוד משימות עבור הציבור.

"ברגע שהאימג' הופך לטקסט, אנחנו יכולים להתחיל לחקור אותו"

אז איך זה עובד? באתר ייעודי של הפרויקט מקבל כל משתמש תמונה של הטקסט המקורי ואת התרגום של התוכנה. באופן פשוט הוא מתקן את מה שנראה לו כטעות. ברגע שיש מספר משתמשים שונים שמסכימים על התיקון – התיקון מתקבל. בסופו של תהליך, יהפכו מאות העמודים של כל כתב היד לקבצים של טקסט, שיהיו גם נגישים לקהל הרחב וגם טקסט שיאפשר לחוקרים להשתמש בתוכנות של BIG DATA כדי לחפש ולחקור אותו לעומק.

"ברגע שהאימג' הופך לטקסט, אנחנו יכולים להתחיל לחקור אותו. לתוכנה של כריית מידע אין בעיה לקרוא אלפי ועשרות אלפי עמודים בזמן קצר ולתת לנו מידע על פי שאלות שנשאל אותה. ברגע שהכל הופך לטקסט, לגודל יש הרבה פחות משמעות כי בעזרת כמה חיפושים של התוכנה נוכל להגיע לטקסט שנרצה. זוהי פריצת דרך בחקר כתבי היד העתיקים העבריים – ואין מתאים יותר מהציבור, בארץ ובחו"ל, להיות שותף שלנו לכך", סיכמו החוקרים.

החל מחג השבועות עובר הפרויקט לשלב חדש, עם ישראל מוזמן להצטרף למתן תורה. מדי שבוע בשבוע יועלו כתבי היד של מדרשים לפרשת השבוע, אותם הצליח המחשב לקרוא באופן חלקי. כל אחד ואחד מכם מוזמן יהיה לתרום את חלקו, לתקן מנה יומית או שבועית של שורות, ויחד לקבל את התורה ולהנגישה לרבים. אז אם גם אתם רוצים להצטרף לפרויקט, לחצו כאן והתחילו לתקן:

מומלץ עד מאוד גם להצטרף לקבוצת הפייסבוק של הפרויקט, שם תוכלו לקבל תמיכה והדרכה, לשתף בהישגים שלכם ועוד:

כאן באתר נעקוב אחרי הפרויקט, נביא מדי שבוע עדכונים על קצב התקדמות הפרויקט ודברי תורה וחידושים שיעלו מתוך העבודה והעיון בחומרים.

מצאת טעות בכתבה? התוכן בכתבה מפר זכויות יוצרים שבבעלותך? נתקלת בפרסומת לא ראויה? דווח/י לנו
תגובה חדשה * אין לשלוח תגובות הכוללות מידע אסור, לרבות דברי הסתה, דיבה ולשון הרע. נפגעת מתגובה? דווח לנו
3 תגובות - 2 דיונים מיין לפי
1
פרוייקט מוזר ביותר. חכמת המונים? מה זה שייך
יוסף | 07-06-2019 13:58
זו עצלות של החוקרים. להסתמך על אנשים שלא ראו כתב יד בימי חייהם זוהי עצלות וטפשות גם יחד. אין תחליף לעבודה קשה. ואני כותב זאת אחרי שנים רבות של קריאת כתבי יד רבים מאוד.
לא טפשות ולא עצלות
משה לביא | 10-06-2019 19:03
יוסף היקר,- לא עצלות ולא טפשות מנחות אותנו, אלא מבט קדימה על אלפי כתבי יד שטרם זכו להיות זמינים, והבנה כמה גדולה המתנה שניתנה לנו בעידן האלקטרוני, לעשות תהליכים ארוכים מורכבים ומוצלחים שיאפשרו לתת מענה למה שלא יהיה לו מענה גם אם יהיה לנו תקציב לממן עשרות חוקרים. הציבור מצליח יפה, מתקן לא רע כתבי יד פשוטים. מה שהוא עושה משמש אותנו כדי לאמן ולשפר את ביצועי המכונה. בעזרת המאמצים הללו, בלי נדר, בעוד עשר שנים, רוב כתבי היד העבריים יהיו זמינים לחיפוש גוגל אפקטיבי - לא ברמה של ודאות של מהדורה מדעית, לא את זה אנחנו מביאים כאן, אבל כן ברמה של נגישות ואפשרות לשימוש ולהגעה למידע. המצויינות האקדמית תבוא בעקבות הפרוייקט הזה, בזכות הפרוייקט הזה, והפרוייקט הזה לא בא להחליף אותו. יתרה מכך, גם מטרה חינוכית ציבורית יש לנו - בעידן זה, איך ידע הציבור על כתבי יד ? איך ידע הציבור על העבודה הרבה הנדרשת? איך נוכל להמשיך לקיים את תחומי הרוח, אם לא נקיים אותם במרחב הציבורי של היום. זה מתן תורה בעיני. חג שבועות שמח!
2
אתר מעולה
רות | 07-06-2019 14:29
נהנית מאוד להכיר את הגניזה הקהירית, בצורה שלא הייתה אפשרית בלי האתרים