top of page

מתמטיקה שימושית של התממה

  • Writer: shlomoyona
    shlomoyona
  • Mar 25
  • 2 min read

1 month ago • Visible to anyone on or off LinkedIn

כרגיל, מאמר שווה התייחסות של ד"ר אורי איתי Uri Itai, Ph.D (קישור בתגובה הראשונה). אז מה אומר אורי?

שלמה יונה

מייסד ומדען ראשי, מתמטיקאי מחקר ופיתוח בע"מ


053-7326360

shlomo.yona@mathematic.ai 

https://mathematic.ai


פודקאסט על החברה ועליי, שלמה יונה, ואופן העבודה שלנו ואיתנו: A technical deep dive about Mathematic.ai.

התפיסה לפיה "נתונים טובים ומדויקים יותר מובילים לתוצאות טובות יותר" עלולה להוות סכנה של ממש לפרטיות, במיוחד בתחומים רגישים כמו רפואה.


אנונימיזציה מסורתית אינה מספיקה. הסרת פרטים מזהים ישירים כמו שם, כתובת או תעודת זהות יוצרת תחושת ביטחון שקרית.



אורי מספר על K-Anonymity ביחד עם t-closeness ועם I-diversity. זה טוב וזה מספיק לרגולטורים רבים במצבים רבים ואפשר לומר שעם זה יוצאים ידי חובה בהרבה מקרים. יחד עם זאת לאנליסטים מיומנים לא קשה מידיי ולא מאתגר מידיי להצליב נתונים נוספים ממקורות אחרים או לפעמים גם מספיק common sense כדי לזהות את הפריטים שלכאורה מותממים.



הפתרון של למידה פדרטיבית הוא פתרון שלצערי לא משתמשים בו מספיק. הוא טוב ומועיל מכל כך הרבה סיבות ולא רק אנונימיות אלא גם לטובת ביזור משאבי מחשוב, סובלנות לתקלות ועוד. אני אוהב מאוד את הפרדיגמה של Federated Learning.



פרטיות דיפרנציאלית היא פן אחד של אותה הפעולה שבפן אחר שלה משתמשים כדי לייצר נתונים סינתטיים ולהעשיר אוספי נתונים. למרות האתגרים, יצירת נתונים סינתטיים היא שיטה נפוצה לאיזון אוספי נתונים. שילוב Differential Privacy בתהליך זה מאפשר להגדיל את ייצוג קבוצות המיעוט מבלי לחשוף את המידע הרגיש של האנשים הבודדים המרכיבים אותן.



אני מסכים עם אורי שחשוב לחשוב על פרטיות מרגע הגדרה של מערכת ולהנדס את הפרטיות כדרישה מהרגע הראשון ולא לבנות אותה כטלאים בהמשך. יחד עם זאת יש מתח וקושי לא מבוטל מול דרישה אחרת של הסברתיות שאינה מוכנה לקבל את המערכות כקופסה שחורה ולכל תוצאה דורשים הסבר מנומק והוכחה שאין הטיות ואין הפליות ויכולת להסביר מדוע ולפעמים אפילו כיצד התקבלה התשובה שהתקבלה. יש פה איפוא, אתגר לאחוז את החבל בשני קצותיו.


התפיסה לפיה "נתונים טובים ומדויקים יותר מובילים לתוצאות טובות יותר" עלולה להוות סכנה של ממש לפרטיות, במיוחד בתחומים רגישים כמו רפואה.



אנונימיזציה מסורתית אינה מספיקה. הסרת פרטים מזהים ישירים כמו שם, כתובת או תעודת זהות יוצרת תחושת ביטחון שקרית.





אורי מספר על K-Anonymity ביחד עם t-closeness ועם I-diversity. זה טוב וזה מספיק לרגולטורים רבים במצבים רבים ואפשר לומר שעם זה יוצאים ידי חובה בהרבה מקרים. יחד עם זאת לאנליסטים מיומנים לא קשה מידיי ולא מאתגר מידיי להצליב נתונים נוספים ממקורות אחרים או לפעמים גם מספיק common sense כדי לזהות את הפריטים שלכאורה מותממים.





הפתרון של למידה פדרטיבית הוא פתרון שלצערי לא משתמשים בו מספיק. הוא טוב ומועיל מכל כך הרבה סיבות ולא רק אנונימיות אלא גם לטובת ביזור משאבי מחשוב, סובלנות לתקלות ועוד. אני אוהב מאוד את הפרדיגמה של Federated Learning.





פרטיות דיפרנציאלית היא פן אחד של אותה הפעולה שבפן אחר שלה משתמשים כדי לייצר נתונים סינתטיים ולהעשיר אוספי נתונים. למרות האתגרים, יצירת נתונים סינתטיים היא שיטה נפוצה לאיזון אוספי נתונים. שילוב Differential Privacy בתהליך זה מאפשר להגדיל את ייצוג קבוצות המיעוט מבלי לחשוף את המידע הרגיש של האנשים הבודדים המרכיבים אותן.

אנחנו חיים בתקופה מעניינת ומרתקת :-) צריכים עזרה עם אנונימיזציה? שיפור אלגוריתמים? לטפל בנתונים שלכם? ארכיטקטורה של נתונים? דברו איתי: שלמה יונה

מייסד ומדען ראשי, מתמטיקאי מחקר ופיתוח בע"מ


053-7326360

פודקאסט על החברה ועליי, שלמה יונה, ואופן העבודה שלנו ואיתנו: A technical deep dive about Mathematic.ai.

 
 
 

Comments


  • Facebook Social Icon
  • LinkedIn Social Icon

© 2010-2026 mathematic.ai

bottom of page