Crisis Engineering: Time-Tested Tools for Turning Chaos into Clarity. מה למדתי מהספר?
- shlomoyona

- Apr 9
- 8 min read
ממש עכשיו בימים האחרונים ראה אור הספר Crisis Engineering: Time-Tested Tools for Turning Chaos into Clarity שכתבו שלושה מומחים בעלי ניסיון עשיר בניהול מערכות טכנולוגיות ומשברים ממשלתיים ועסקיים.
מחזור החיים של המשבר
המודל התיאורטי מחזור החיים של המשבר, שמזהה דפוס חוזר של ארבעה שלבים שמאפיינים התמוטטות של מערכות מורכבות.
השלב הראשון הוא האות, שבו המערכת משדרת סימני מצוקה מוקדמים. הספר מנתח מדוע שכבות הניהול נוטות להחמיץ אותות חלשים אלו באופן עקבי, ותולה זאת בהטיות קוגניטיביות, בפחד של עובדים לדווח על חדשות רעות ובהסתמכות על מדדי ביצוע שגויים שיוצרים עיוורון מערכתי.
השלב השני הוא ההלם, נקודת האל-חזור שבה הכישלון הופך לגלוי, פומבי ובלתי ניתן להכחשה. זהו הרגע שבו המערכות קורסות והמחדל נחשף לעיני הלקוחות והתקשורת.
מיד לאחר מכן מגיע שלב התגובה, שבו הארגון מנסה לבלום את ההידרדרות. המחברים מסבירים כי בשלב זה תהליכים שגרתיים לרוב קורסים, וניסיונות ליישם פתרונות רגילים על בעיה יוצאת דופן עלולים להחמיר את המצב ולחייב התערבות ברוח הנדסת משברים.
השלב האחרון הוא ההתחדשות, שמתרחש לאחר סיום המשבר. בשלב זה ארגונים רבים נכשלים בלמידה ומפגינים נטייה הרסנית לחזור לסטטוס-קוו הקודם במקום לבנות מערכת חסונה יותר. הספר מציע למנהיגים כלים קונקרטיים להתערבות בכל אחד מהשלבים הללו, במטרה למנוע חזרה עיוורת לשגרה הפגומה שהובילה למשבר מלכתחילה.
חמשת האותות לזיהוי משבר מתהווה
אחד הכלים האנליטיים המרכזיים שהספר מעניק לקוראיו הוא היכולת להבחין בין תקלה תפעולית חמורה לבין משבר אמיתי, מצב שלפעמים נקרא אירוע קוסמולוגי. ההבחנה הבסיסית ביותר של משבר היא היותו אירוע חדשני שעבורו אין ספר נהלים קיים בארגון. היעדר תוכנית מגירה מוכנה הוא שמחייב מעבר לניהול אד-הוק יצירתי והנדסי. הספר מגדיר חמישה סממנים מובהקים שהופעתם המשותפת מעידה על קיומו של משבר מערכתי שמחייב התערבות של הנדסת משברים.
הסממן הראשון הוא הפתעה יסודית שכוללת אירועים שהמערכות הארגוניות לא יכלו לחזות משום שהם מפרים את הנחות היסוד של המערכת.
במקביל מתרחשת קריסה תפיסתית, שהיא סימן פסיכולוגי מסוכן המאופיין באובדן ההבנה המשותפת בתוך הארגון ובאובדן היכולת לגבש תמונת מציאות אחידה.
סימן שלישי הוא שיבוש בתפקודי הליבה, שבו הארגון מאבד את היכולת המהותית לספק את השירותים או המוצרים הבסיסיים שעבורם הוא קיים.
בנוסף לאלו, המשבר מתאפיין בנראות גבוהה וחיכוך פומבי מול לקוחות, תקשורת ורגולטורים, מה שיוצר רעש המקשה על קבלת החלטות.
לכך מתווספים לוחות זמנים קשיחים ובלתי מתפשרים, שמייצרים לחץ זמן אבסולוטי שבו כל השהיה בהחלטה מחריפה את הנזק.
זיהוי חמשת האותות הללו אינו רק אבחנה אקדמית; כאשר כולם מתקיימים, נוצר חלון הזדמנויות שבו חוקי הארגון הרגילים מושהים, מה שמאפשר לצוות משבר קטן להנדס שינוי עמוק במערכת.
מלכודת הטייס האוטומטי
אחת התזות המאתגרות בספר היא הביקורת החריפה על האינסטינקטים של הנהלות מסורתיות בעת משבר. בימים כתיקונם, ארגונים פועלים במצב של טייס אוטומטי שמבוסס על נהלים כתובים, היררכיה ברורה ותהליכי אישור רב-שלביים שנועדו לייצר יעילות וצמצום סיכונים. אולם, כאשר מתרחש משבר עמוק שאין עבורו ספר נהלים, המנגנונים הללו אינם מסוגלים להתמודד עם שפע הבעיות הבלתי צפויות.
הספר מפרט מדוע האינסטינקטים הניהוליים השגרתיים נכשלים תחת לחץ. כאשר פורץ כאוס, התגובה האוטומטית של מנהלים היא לנסות להאט את הקצב, לדרוש נתונים מושלמים ולהקים ועדות חקירה. צעדים הגיוניים אלו מחבלים למעשה בסיכויי ההתאוששות; הניסיון לאסוף מידע מושלם מוביל לשיתוק אנליטי, היררכיות מורכבות מונעות יוזמה מהדרג המקצועי בשטח, והסתמכות על יועצים חיצוניים שמנותקים מהאירוע גוזלת זמן יקר על עדכוני סטאטוס חסרי תוחלת.
דיקרסון מסביר כי הרגע שבו הטייס האוטומטי חדל מלהיות אפקטיבי הוא בדיוק הזמן שבו מתאפשרת הנדסת משברים אמיתית. בזמנים רגילים ארגונים מתנגדים לשינוי בעוצמה רבה, אך בזמן משבר ההתנגדות הבירוקרטית נשברת. אלו הם הזמנים שבהם ניתן לבצע שינוי מהיר ובר-קיימא בקצב גבוה פי כמה מכל זמן אחר. לכן, במקום לנסות לשמר את המבנה הישן, יש לאמץ מודל אופרטיבי שונה בתכלית.
המודל האופרטיבי השונה
המודל האופרטיבי שהספר מציע מבוסס על מעבר מהיר ממבנה היררכי איטי למבנה גמיש וממוקד פעולה שנקרא הנדסת משברים. עקרון המפתח הראשון הוא הקמת חדרי מלחמה שמשמשים כמרכז עצבי לריכוז כל המידע הרלוונטי במקום אחד. בניגוד לישיבות הנהלה רגילות, סביבה זו מאפשרת גיבוש תמונת מציאות משותפת בזמן אמת ללא תיווך בירוקרטי. במקביל, המודל מחייב סמכות החלטה מבוזרת ומועצמת שמבטלת את הצורך באישורים רב שלביים ומעניקה סמכויות לאנשים שקרובים ביותר לבעיה.
היבט מרכזי נוסף הוא נזילות תפקידים, שבה הגדרות התפקיד הישנות מושהות לטובת לקיחת אחריות לפי צורך וכישורים שרלוונטיים לרגע המשבר. המדידה בארגון משתנה אף היא ועוברת לתיעוד ממוקד התאוששות שבוחן נתונים קריטיים להמשכיות העסקית במקום מדדי ביצוע שגרתיים. גישה זו מקדמת שקיפות מלאה בנתונים ובניית אמון פנימי בתוך הצוות שמטפל באירוע.
המודל דוגל בהעדפת פעולה על פני תכנון מושלם מתוך הבנה שמידע מלא אינו בנמצא בערפל הקרב. למידה תוך כדי עשייה וביצוע ניסויים מהירים נחשבים יעילים יותר מתכנון אסטרטגי איטי בזמן שהמערכת קורסת. כל זאת מתבצע תוך שימור אנושיות, שכולל מתן גיבוי לטעויות וגילוי אמפתיה כלפי הצוותים שפועלים תחת לחץ קיצוני, במטרה למנוע תרבות של חיפוש אשמים שמעכבת את התיקון המערכתי.
מעבר לכלים הניהוליים, הספר כולל העמקות טכניות רבות שמיועדות למהנדסים ואנשי טכנולוגיה. סעיפים אלו מספקים צלילה תיאורטית עמוקה לאופן שבו פועלות רשתות, תלויות במסדי נתונים ועקרונות יציבות שנלקחו מעולמות הנדסת אמינות אתרים. הכלים האלו נועדו להיות מודולריים, כך שמנהלים יכולים לבחור כלים מסוימים ולהחיל אותם בארגון ללא צורך ביישום מתודולוגיה משברית מלאה.
ביקורת על הספר
לצד קבלת הפנים האוהדת, קיימת ביקורת על מתודולוגיית הנדסת המשברים שחושפת מגבלות וסיכונים ביישום השיטה. אחת הטענות המרכזיות היא שקיים פוטנציאל לשימוש לרעה במושג משבר ככלי לשבירת נהלים והיררכיה. מנהלים עלולים להכריז על מצב חירום באופן סובייקטיבי כדי לעקוף התנגדויות, להדק שליטה פוליטית או לייצר תחושת דחיפות מלאכותית, דבר ששוחק את אמון העובדים ועלול להוביל לפיטורים שרירותיים. זה מזכיר, להבדיל אלפי הבדלות, את הספר של נעמי קליין, דוקטרינת ההלם, שם טענה שמנצלים משברים לשינויים מהותיים.
ביקורת נוספת נוגעת למחיר הפסיכולוגי הכבד שנגבה מהעובדים. מודל העבודה בחדרי מלחמה ודרישת הזמינות התמידית אינם מתאימים לכל אדם ועלולים להוביל לשחיקה מהירה ולפגיעה בבריאות הנפשית. ניהול שמבוסס על מצבי קיצון אינו בר-קיימא לטווח ארוך, והוא עלול לדחוק החוצה טאלנטים שקטים או מופנמים שכישוריהם חיוניים, אך הם מתקשים לתפקד בסביבות רועשות וחסרות ודאות.
בנוסף, קיימת התנגשות מובנית עם תרבויות של הנדסה שגרתית במגזרים מסורתיים שמעדיפים תכנון מוקדם ודיוק על פני עבודה מבוססת ניסוי וטעייה. ניסיון לאכוף מתודולוגיה שמתאימה לחברות הייטק על תעשיות מסורתיות עלול להיתקל בהתנגדות עזה מצד מהנדסי שטח ולגרום לאובדן שליטה בסטנדרטים של איכות ובטיחות.
לבסוף, המבקרים טוענים שמיקוד יתר בכיבוי שריפות טקטי בא על חשבון ראייה הוליסטית ואסטרטגית. הנטייה להציל את המערכת כאן ועכשיו עלולה לייצר פתרונות זמניים שמעמיסים חוב טכני ומסבכים את התחזוקה העתידית. קיימת סכנה שהמעבר המהיר לסמכויות חירום יקסום למנהלים במידה כזו שיתקשו לוותר עליהן, מה שימנע את שלב ההתחדשות ויקבע מצב של כאוס מתמשך בארגון.
הנה טבלת השוואה שמרכזת את היתרונות של מודל הנדסת המשברים מול נקודות התורפה והסיכונים שפורטו בביקורת:
התבחין להשוואה | יתרונות מודל הנדסת המשברים | נקודות תורפה וסיכונים במודל הנדסת המשברים |
מהירות ותגובה | מאפשר קבלת החלטות מהירה ושינוי עמוק בזמן שחוקי הארגון מושהים. | עלול להוביל לשיתוק אסטרטגי עקב התמקדות בכיבוי שריפות טקטי בלבד. |
מבנה ארגוני | שובר בירוקרטיה והיררכיה איטית לטובת גמישות וחדרי מלחמה. | מנהלים עלולים לנצל את המצב כדי לעקוף נהלים באופן שרירותי ולצבור כוח פוליטי. |
הון אנושי | מעצים את הדרג המקצועי שקרוב לבעיה ומאפשר נזילות תפקידים. | גורם לשחיקה מהירה ולפגיעה בבריאות הנפש; עלול להפלוט עובדים מופנמים. |
פתרון בעיות | מעדיף פעולה וניסויים מהירים על פני תכנון מושלם בערפל קרב. | יוצר פתרונות זמניים שמעמיסים חוב טכני ומקשים על תחזוקה ארוכת טווח. |
תרבות עבודה | מתאים לסביבות טכנולוגיות דינמיות שרגילות לשינויים מהירים. | מתנגש עם מגזרים מסורתיים שזקוקים לתכנון מדויק ושמירה על כללי בטיחות קשיחים. |
שלב הסיום | פותח פתח להתחדשות ולבניית מערכת חסונה יותר מהיסוד. | סכנה של התמכרות למצב החירום וקושי בחזרה לשגרה ולניהול תקין. |
כיצד זה רלוונטי למנהלים בכלל ובטכנולוגיה בפרט?
חשיבותו של הספר חורגת מגבולות הדיון הארגוני הצר ונוגעת בלב הדיונים האקדמיים בנושאי מנהל ציבורי ומדעי המחשב, כאשר החומרים שמרכיבים אותו התגבשו ממערכי שיעור אקדמיים דוגמת קורס ניהול מערכות מורכבות באוניברסיטת פומונה. שילוב תכנים אלו באקדמיה מוכיח שדיסציפלינת הנדסת משברים מתגבשת כתחום דעת עצמאי, בדומה להתפתחות ההיסטורית של הנדסת תעשייה וניהול.
בהקשר של ניהול טכנולוגי והנדסה, הספר מציע כלים לבחינת היכולת האופרטיבית של ארגונים להתמודד עם אתגרים קיצוניים, תוך הדגשת הצורך במשבר כדי להניע חדשנות שנדחתה. תפיסה זו מספקת פרספקטיבה קריטית עבור בדיקת נאותות טכנולוגית שבוחנת את הגמישות והחוסן של התשתית ההנדסית, מעבר להערכת הקוד והארכיטקטורה.
בתחום משאבי האנוש והניהול הטכנולוגי, הספר מעודד שקיפות קיצונית והפעלת צוותים מתוך הכרה בעומק המשבר, דבר שיוצר לכידות קבוצתית שעולה על תמריצים כלכליים רגילים. הבנת עקרונות אלו מאפשרת לאנשי מקצוע לבצע בדיקת נאותות טכנולוגית מעמיקה, שמוודאת שקיימת תרבות ארגונית וכלים הנדסיים לפתרון כשלים בזמן אמת, דבר שמהווה חלק מהערכת הסיכון של חברות טכנולוגיות מודרניות.
הקבלת הנדסת המשברים לעולם המחקר האלגוריתמי
הספר טוען שפי שמערכות מורכבות קורסות משום שארגונים מסתמכים על טייס אוטומטי ניהולי וטכנולוגי שאינו מסוגל להתמודד עם הפתעות. תפיסה זו מהדהדת את הפילוסופיה שלנו ב- Mathematic.ai, שטוענת שצוותי מדע נתונים רבים נשענים על מתודולוגיות גנריות שנועדו להיכשל כשהן נתקלות באתגרים חדשים שמאופיינים באי-ודאות גבוהה. אנחנו תופסים את המחקר ככלי שנועד לגשר על הפער שבין השגת יעדים עסקיים לבין חוסר הוודאות שמאפיין פרויקטי מחקר אלגוריתמי יישומי בכלל וכאלה שמערבים למידת מכונה ובינה מלאכותית בפרט.
ממש כפי שהמחברים מקימים חדרי מלחמה כדי להציל מערכות שקרסו, כך נדרשים צוותים חזקים כמו שלנו להתערב בפרויקטים מורכבים כדי לחלץ אותם מקיפאון ולהפוך מודלים תיאורטיים לפתרונות עובדים בסיבות פרודקשן. העיקרון שמופיע בספר ומעדיף פעולה על פני תכנון מקביל לעבודת מפתח האלגוריתמים המודרני, שחייב לגעת בנתונים ולבחון מודלים בפועל במקום לשקוע בשיתוק של תכנון אקדמי וחקירת תיאוריות בארגז חול מבודד. עם זאת, יישום של מתודולוגיה כזו בעולמות הפיתוח האלגוריתמי מעלה מספר מגבלות, במיוחד כשמדובר בתעשיות רגישות שדורשות אמינות גבוהה.
בתעשיות כגון סייבר, מערכות ביטחוניות ומכשור רפואי, יישום נמהר של פתרונות זמניים ועקיפת נהלים עלולים להיות הרסניים. פתרונות מהירים שמרכיבים תחת אש הופכים לעיתים לקופסאות שחורות שקשה לבדוק ולהעריך, דבר שסותר את הצורך בבינה מלאכותית בת-תחזוקה. בניגוד לקיצורי הדרך שהספר מעודד, מחקר אלגוריתמי יישומי ראוי נועד לפתור את בעיות השורש כדי למנוע את הצורך בניהול משברים מתמיד ולהבטיח שהתשתיות יוכלו לפעול ביציבות לאורך זמן מול אתגרי הנתונים העתידיים.
לבסוף, קיימת סכנה של שחיקת כשרונות בארגון שמקדש ניהול מבוסס משברים וכיבוי שריפות. אנחנו דוגלים בחשיבות בניית צוותים מותאמים שפותרים בעיות בצורה שיטתית ויצירתית. סביבה שמעודדת התנהלות של צוותי קומנדו בלבד מסתכנת באובדן של חוקרי אלגוריתמים רציניים שזקוקים לסביבה ממוקדת כדי לרדת לשורשן של בעיות מתמטיות וסטטיסטיות מורכבות, דבר שעלול לפגוע ביכולת הארגונית לפתור בעיות בלתי רגילות בטווח הארוך.
סיכום
ספר מעניין ומלמד שמרכז ידע בנושא המשברים וניהולם. מעבר לארגון הידע וההבנה בנושא ומעבר למודעות הנושא ולאופן ההתנהלות המומלץ יש עם הקריאה בספר ולאחריה מקום להרהר באופן שבו אנחנו מנהלים את הארגונים שלנו ויכולים גם למנוע משברים וגם לסייע בקרות-מקרה להתמודד באופן יעיל יותר ולהחלץ מהמשבר.

מחקר אלגוריתמי יישומי חייב להיות מעשי ולשרת מטרות עסקיות מדידות, תוך התמודדות עם נתונים רועשים ומגבלות זמן אמת. באופן דומה, מחברי הספר מדגישים עבודה של ידיים על המקלדת בתוך הארגון בזמן משבר, ומעבר מתגובה פסיבית ליכולת ביצועית ממשית ותיקון שורש הבעיה.
נושא נוסף שמחבר בין השניים הוא השקיפות והצורך בהסברתיות. אנחנו ב-Mathematic.ai גורסים כי תוצרי המחקר חייבים להיות ניתנים להסבר כך שיהיה ברור למקבלי ההחלטות מדוע האלגוריתם הגיע למסקנה מסוימת וגם כדי שתהיה להם עצמאות ויכולת עצמאית להבין מה קורה, מדוע וכיצד ושיוכלו לשנות, להרחיב ולהעמיק לפי רצונן ולפי הצרכים שלהם. הספר Crisis Engineering מתמקד ביצירת בהירות מתוך הכאוס, כאשר היכולת להבין מערכות מורכבות ולהציע אפשרויות מובנות עם פשרות ברורות היא קריטית לניהול משברים מוצלח.
עוד משותף בין הערכים והכלים שעולים מהספר בקנה אחד יחד עם הגישה שלנו למחקר אלגוריתמי יישומי: שתי הגישות דוגלות בעבודה בסבבים מהירים ובניית מערכות עמידות. המחקר היישומי מתבצע בשיטה המאפשרת לבחון תוצרים יומיומיים ולעדכן עדיפויות על סמך ראיות מוצקות. המתודולוגיה של הנדסת משבר מיועדת בדיוק למצבים שבהם תכנון קפדני ארוך טווח אינו רלוונטי, והיא מלמדת כיצד להקים מאמץ הנדסי מהיר שהופך כישלונות מערכתיים להזדמנות לעיצוב ארכיטקטורות חסינות יותר.
מתמטיקאי מחקר ופיתוח בע"מ מספקת שירותים של מחקר אלגוריתמי יישומי. יש לכם מחקר יישומי שנתקע בבוץ? יש קשיים להעביר מחקר לפרודקשן? אולי בפרודקשן הביצועים בכלל ולאורך זמן בפרט אינם נראים כמו בהוכחות ההתכנות? אנחנו יכולים לעזור.
דברו איתי:
שלמה יונה, מייסד ומדען ראשי, מתמטיקאי מחקר ופיתוח בע"מ
053-7326360

.png)
Comments