רן בר-זיק לפני 16 שנים כ- 4 דקות קריאה
גוגל עדיין לא התגברה על בעיית החיפוש הסמנטי | אינטרנט ישראל
גוגל מודה בבעיה בסריקת הרשת העמוקה
גוגל נתקלת בבעיות לא צפויות בחיפוש הסמנטי שלה ומידע נוסף על הרשת העמוקה, היא ה-Deep Web.
- רן בר-זיק
- קטגוריה: חדשות אינטרנט
- תגיות: חדשות אינטרנט
פרופסור אלון הלוי, שמוביל את צוות סריקת הרשת העמוקה מודה ש"לגוגל יש בעיות בסריקת מבני נתונים" וכשהוא מדבר על מבני נתונים הוא מתכוון לרשת העמוקה.
הרשת העמוקה או Deep Web הוא כינוי למאגרי נתונים ודפים שניתן להכנס ולסרוק אותם רק באמצעות שימוש בטפסים, סיסמאות או מנגנוני ניווט אחרים ושאינם יכולים להכנס לאינדקס על ידי סריקת קישורים.
על פי הלוי, בעוד שברשת האינטרנט הרגילה (או הרדודה) יש 5 מיליארד דפי אינטרנט, ייתכן שברשת האינטרנט העמוקה ישנה כמות דפים גדולה יותר פי 500 (!!!) גוגל סורקת כיום את הרשת העמוקה בעזרת מנגנון חיפוש במאגרי מידע שאינו כל כך יעיל. דרך נוספת ויעילה הרבה יותר לחקור את הרשת העמוקה היא באמצעות חיפוש סמנטי.
גוגל מנסה מגוון של שיטות חיפוש על מנת להתמודד עם הבעיה של הרשת העמוקה. ייתכן שהפתרון לא מצוי בשיפור מנוע החיפוש הנוכחי אלא בבניית שיטת חיפוש חדשה לגמרי. כאמור הלוי מוביל צוות של מומחים שמנסה ובוחן מגוון שיטות. יאהו! שהיא המתחרה הגדולה ביותר של גוגל (לפחות בחו"ל, בארץ כמעט ולא משתמשים במנוע החיפוש הזה שמתקשה להביא תוצאות מדויקות בעברית) גם נמצאת במירוץ לפיתוח כלי לחיפוש ברשת העמוקה והיא אף מקדימה את גוגל כיוון שהיא אוחזת ב-Search Monkey שהוא מנוע חיפוש סמנטי מתקדם שכבר נמצא בשימוש.
ללמוד תכנות בעברית
ללמוד תכנות מעשי מאפס, בעברית ובקלות עם הספר שלי ״ללמוד ג׳אווהסקריפט בעברית״
רן בר-זיק
ארכיטקט תוכנה בכיר בסייברארק, עיתונאי טכנולוגיה בעיתון דה מרקר, מרצה בקריה האקדמית אונו ואוניברסיטת חיפה, אב לארבעה ילדים.
פוסטים מומלצים
שקופית קודמת
שקופית הבאה
פוסטים נוספים שכדאי לקרוא
פתרונות ומאמרים על פיתוח אינטרנט
המנעו מהעלאת source control לשרת פומבי
לא תאמינו כמה אתרים מעלים את ה-source control שלהם לשרת. ככה תמצאו אותם וגם הסבר למה זה רעיון רע.
פברואר 11, 2024 תגובה אחת
למפתחי ובוני אתרי אינטרנט
בדיקת נגישות של קבצי PDF באופן ידני
מאמר מבוא המסביר איך בודקים מבחינת נגישות קובץ PDF באופן מזדמן ובחינם
אפריל 14, 2024 אין תגובות
רשת האינטרנט
המגבלות של Tor והאפשרות לחיבור דרך VPN
איך אפשר להפיץ מידע אנונימי ולהתפס למרות שמשתמשים ב-Tor ואיך נמנעים מזה.
מאי 26, 2024 5 תגובות
פתרונות ומאמרים על פיתוח אינטרנט
למה כדאי להכיר פיצ׳רים חדשים של CSS
האם בעולם שבו ChatGPT יוצרת קוד פרונט אנד במהירות – כדאי בכלל ללמוד ולהכיר CSS?
מרץ 24, 2024 8 תגובות
מידע כללי על אינטרנט
מה זה Mac address ולמה זה חשוב לפרטיות
מידע על הכתובת הפיזית שכל מכשיר מקבל וההשלכות של הכתובת הזו על הפרטיות.
יוני 2, 2024 2 תגובות
רספברי פיי
להריץ מודל בינה מלאכותית על רספברי פיי
דקות בודדות ויש גם לכם LLM שרת מקומית לשימושים שונים ומגוונים. כן, גם על מכונה חלשה.
מאי 5, 2024 2 תגובות