In Grep We Trust: קיצורי דרך מועילים להכנת מפתחות לספרים

פוסט ספציפי בקיצוניות היום; לא זו בלבד שנדבר על הכנת מפתחות (אינדקסים) לספרים, בילוי שמלכתחילה מעטים העוסקים בו, אלא שנגלה קיצורי דרך מעולים שמתאימים רק לספרים מסוימים. אם טעמכם דומה לזה של הסטודנט שלי שחיווה את דעתו (הלגיטימית!) על הנושא במילים "חבל רק שזה הורג את הנשמה" – חכו לפוסט אחר לגמרי באמצע השבוע הבא.
וכעת משנשארנו קבוצה קטנה אך אנינת טעם, אספר לכם שממש בקרוב עתיד לראות אור בהוצאת למדא של האוניברסיטה הפתוחה ספר עב כרס בתחום הגנטיקה. הכנת מפתח לספר כזה היא לרוב עבודה תובענית שדורשת עבודה של כמה חודשים, כלומר היא יקרה גם בזמן וגם בכסף. אבל כאן, כפי שכבר הבנתם, זכינו לקפיצות דרך מסוימות.
המסלול המהיר
השלב הראשון בהכנת מפתח הוא ריכוז כל המונחים שברצוננו לכלול בו. לשם כך מישהו – המחברת, העורך המדעי, עורכת הטקסט או ממפתח שזה מקצועו – צריכים לעבור על הספר, למעשה לקרוא אותו במהירות, ולסמן כל מונח רלוונטי, מ"פעמוני שלג" עד "מלחמת הקומקום", בהתאם לתחום ולנושא (וכן, "מלחמת הקומקום" היא דבר אמיתי שהתרחש במאה ה-18). במקרה זה הבנו שנוכל להשתמש ברשימות המונחים המרכזיים שמופיעות ממילא בסופי כל הפרקים בספר. די למזג את כל הרשימות האלה, לארגן אלפביתית ולמחוק כפילויות, עבודה של שעות ספורות.
מה יהיה חסר די בהכרח ברשימות כאלה? בעיקר שמות אישים, רובם חוקרים וחוקרות, הנזכרים בספר. אך מכיוון שלכל חוקר או חוקרת מופיע פעם אחת שמם באותיות לועזיות בסוגריים, חשבתי שאולי נוכל לחפש אותם אוטומטית, שהרי מדובר ברצף טקסט בעל צורה אופיינית מאוד: שתי מילים בעברית (בדרך כלל) ואחריהן סוגריים ובתוכם שתיים או שלוש מילים באותיות לועזיות שמתחילות באותיות גדולות (CAPS).
את הרעיון הזה מימשה שלהבת זוהר, מנהלת הסטודיו של למדא. ביקשתי ממנה לשתף עם הציבור כיצד, והנה התשובה.
מחפשים חוקיות
החיפוש נעשה בתוכנת העיצוב אינדיזיין. שלהבת "יצרה grep של המבנה המבוקש" – קוראי הבלוג הזה יוכלו לנחש שאני אישית לא יצרתי grep מימיי, אבל האינטרנט מספר שמדובר ב"כלי לחיפוש טקסטואלי מבוסס תבניות בתוך קבצים", וזה הגיוני מאוד, ואם למישהו או למישהי תהיה שאלה טכנית, אוכל לבקש הסברים נוספים. מכיוון שלשמות של חוקרים משלל ארצות ולאומים יש כמה מבנים אפשריים – למשל, עם או בלי שם אמצעי או אות עם גרש שמציינת שם אמצעי – שלהבת יצרה grep נפרד בעבור כל מבנה/חוקיות כאלה, והריצה אותו על הספר כולו.
שלהבת החילה סגנון תו מסוים על הרצפים שהתקבלו, כלומר הפכה אותם למעוצבים בסגנון שלא קיים בשום מקום אחר בספר (נשים לב שלשם כך צריך מן הסתם ליצור עותק נפרד, שאינו העותק שעליו נמשכת העבודה על הספר עצמו). את כל מה שמעוצב בסגנון הזה ייצאה למסמך נפרד, וממנו – לקובץ Word.
התוצאה שהתקבלה הייתה מצוינת ונקייה להפליא – היא כללה מונח אחד או שניים שלא היו שמות אבל התאימו לפרמטרים ולכן עלו בחיפוש. בעבודה מינימלית ביותר, יכולתי לארגן את המסמך ולצרף אותו לרשימת המונחים שכבר הייתה בידינו.
מהנקודה הזאת והלאה נמשיך כרגיל (חיפוש המונחים האלה בקובץ הסופי של הספר וציון מספרי העמודים; ולאחר מכן עריכה של התוצאה, כגון חלוקה לתת־ערכים הגיוניים, הוספת הפניות הדדיות וכו'). שני קיצורי הדרך האלה הפכו זמן עבודה רב מאוד (בייחוד בספר כזה, שאורכו כ-1,500 עמודים בשני כרכים) לימי עבודה ספורים.
מן הסתם, הטריקים האלה לא יפעלו בכל ספר. בפרט, טכניקת החיפוש הזאת הייתה אפשרית רק משום ששמות האישים מופיעים באותיות לועזיות בסוגריים, ולא תסייע בספר שזה לא נעשה בו (למשל, משום שהנושא ישראלי ורובם המכריע של השמות הם עבריים). מקווה שיימצאו מי שהם יועילו להם כמו לנו, או שישמחו לגלות שחיפושים כאלה אפשריים וימצאו להם שימושים יצירתיים משלהם.
•
מאחלת זמנים שקטים וטובים, ולכל חיילי צה"ל ואנשי כוחות הביטחון, שתצאו בשלום ותשובו בשלום.
