by admin June 17, 2025 0 Comments

משרות בתחום RT מטריקס משרות

המטרה היא לא לענות לשאלה אחת, אלא לייצר "מוח" (קובץ משקולות) שיוכל לענות על מיליוני שאלות בעתיד. בעוד שאצל ה-Agent התהליך הוא לולאת שיחה (כמו צ’אט), אצל מפתח ה-AI התהליך הוא פס ייצור (Pipeline) איטרטיבי. הגרף הזה מכיל את המצב הנוכחי (State) – למשל, רשימת ההודעות שנצברו עד כה. כדי שהסוכן "יזכור" שיחות קודמות או ידע ארגוני, צריך מסד נתונים וקטורי. הוא לא צריך PyTorch או אימון רשתות, אלא כלים שיודעים "להדביק" את המודל לעולם החיצוני ולנהל את השיחה.

מה כל גישה בעצם עושה?

Embeddings הם הבסיס לכל RAG ופרויקט AI ארגוני.

איך מורידים את Claude Desktop (קלוד דסקטופ): מדריך פשוט בעברית

עבור מטריקס דרוש/ה מפתח/ת .NET תיאור תפקיד מתכנת מוביל במערכת מו"ח – יישומים פיתוח שרותים ותהליכים מבססי עולמות מניה חכמה כתיבת פרוצדורות ושירותים מבוססי מסדי נתונים ניסיון בסביבת אורקל ומסדי נתונים הזדמנות להשתלב בפרויקטים משמעותיים ולעבוד עם אנשי SAP מהטובים בתחום אנחנו מחפשים מפתח/ת SAP CRM מוכשר/ת להצטרפות לצוות פיתוח איכותי, מקצועי וטכנולוגי עבודה על מערכות מורכבות, פיתוחים מתקדמים וסביבה מקצועית עם מקום אמיתי ללמוד, להשפיע ולהתפתח הזדמנות להשתלב בפרויקטים משמעותיים ולעבוד עם אנשי SAP מהטובים בתחום משרה קבועה, היברידית ברמת החייל

פרויקטים רשמיים ב-GitHub

  • הכלים המנוהלים מנסים להיות גמישים יותר, והכלים הפתוחים מנסים להיות פשוטים יותר (למשל Milvus Lite שרץ בתוך הפייתון ללא צורך בשרת).
  • כדי לראות תפקידים מתאימים עליך להוסיף כישורים בפרופיל האישי במערכת COB.
  • מפתח/ת תשתיות DataPower בדגש על IBM API Connect בצוות DEVOPS טיפול בתקלות שוטפות וקריטיות בתחום.
  • חלונות של 1M טוקנים הם סטנדרט בטיר הדגל; תמחור לטוקן ממשיך לרדת.
  • והם הוסיפו עכשיו פיצ’ר של וקטור, אז אתה יכול גם לאחסן את ה-Vectors ובעצם לשלב, לעשות query משולב כזה של Keyword Search פלוס Vector Search ולעשות איזשהו שילוב כזה.
  • אל תנסו להיות מושלמים – תהיו עובדים.
  • כארכיטקט פתרונות, אני רואה ארגונים רבים שטועים בשלב הזה.

72% מהארגונים הבינוניים-גדולים כבר משתמשים באיזשהו Agentic AI. ואם משהו לא עובד, הוא מנסה גישה אחרת. ChatGPT, Gemini, Claude – כלים מדהימים, אבל הם reactive. מקבל משימה, מפרק אותה לתת-משימות, משתמש בכלים, מקבל החלטות ביניים, ומגיע לתוצאה. בגדול, AI שלא רק עונה על שאלות אלא פועל. ההבדל הזה נקרא Agentic AI.

נגיד כשאתם עובדים עם אייג’נטים, אז הרבה פעמים לאייג’נט יש איזשהו תהליך מחשבתי, כן? אני חושב שהיתרון של LangChain top AI development company in Israel זה שאתה יכול לעשות POC ממש מהר, אם זה כבר use-case שהם מימשו, למשל SQL Database Agent שמאפשר לך מטקסט חופשי לעשות שאילתות על הדאטאבייס שלך ולהפוך את התשובה לטקסטואלית גם. אז זה מאוד תלוי מה ה-use-case שלכם, וככה אתם תבינו אם אתם רוצים להשקיע את ה-learning curve הזה וללמוד את הספרייה ולהטמיע דברים כמו שצריך, או שזה סתם POC, דברים כאלה, ואפשר אולי ללכת על כיוונים של… בכלל בלי ספרייה, זה גם אפשרות, כן. זאת אומרת, כשאנחנו אומרים פריימוורק, אז בעצם מה ה-Glue Code, או מה ה-Library שתעשה אורקסטרציה לכל האפליקציה שלכם, ול-LLM כמובן במרכז. ומהצד השני כמובן שיש את המלחמה של AWS, שחברה לכל החברות Close Source, כמו AI21, Tropic וכו’, והם בעצם נותנים גרסאות Close Source על AWS עצמה. WireGuard לעובדים מרוחקים, OpenVPN לאתרים, mTLS בין שירותים.

גישה מתקדמת יותר שמשתמשת ב-Embeddings כדי לזהות גבולות טבעיים בטקסט. מתאים למערכות עם עד מיליון וקטורים, ומעבר לזה הביצועים פחות תחרותיים. מסד נתונים וקטורי קוד פתוח שאפשר להריץ על GCP כ-Container או להשתמש בגרסה המנוהלת שלהם (Weaviate Cloud). הבחירה של Vector Database היא החלטה ארכיטקטונית שמשפיעה על ביצועים, עלות ותחזוקה לאורך זמן. הוקטורים נשמרים במסד נתונים וקטורי שמאפשר חיפוש מהיר לפי דמיון סמנטי.

בינה מלאכותית בעברית ב-2026: מבט כן על איך מודלי שפה מתמודדים עם עברית — ומה באמת עובד בייצור

הכלים המנוהלים מנסים להיות גמישים יותר, והכלים הפתוחים מנסים להיות פשוטים יותר (למשל Milvus Lite שרץ בתוך הפייתון ללא צורך בשרת). תמיד תבדוק את התיעוד של המודל שיצר את הווקטורים – הוא יגיד לך באיזו מטריקה להשתמש. Weaviate ו-Milvus מציעים כלים מובנים לביצוע קוונטיזציה כזו. היתרון הוא שאין צורך לתחזק עוד תשתית. כשאני יושב עם CTOs, השאלה היא תמיד כלכלית לא פחות מאשר טכנולוגית.

עסקים שרוצים לגדול חכם — בכל גודל

גישה זו עובדת מצוין עם מסמכים מובנים כמו חוזים, נהלים ומפרטי מוצר, שבהם לכל סעיף יש כותרת ותוכן ברורים. כשעובדים עם Hugging Face, אז גם הם מציעים Inference-endpoints, שהם עושים בעצם הוסטינג למודל אצלם. אם עובדים עם LangChain, אז גם להפוך את כל החלקים שהם צווארי בקבוק, שזה לרוב הריצה של ה-LLM, להפוך אותם לאסינכרונים זה יחסית פשוט, ואז גם אם יש לנו scale, בדרך כלל השרת הזה יכול לעמוד בו.

מתי כדאי להשתמש ב-RAG?

כדי להבין באמת מה קורה, צריך לצלול לאיך הכלים האלו מוצאים את המחט בערמת השחת. Prototype שעובד אפשר להעמיד בשבוע. בעוד חצי שנה תרצו לבדוק למה תשובה מסוימת הייתה גרועה, ובלי ID לא תמצאו את המסמך. באנגלית אותו אורך מסמך הוא 1,500 טוקנים.

עוד רגע

ופה, בעברית, ההחלטות האלה כפול חשובות. RAG הוא ארכיטקטורה רב-תפקודית, וההמלצות המעשיות משתנות בהתאם לתפקיד שלכם בארגון. הנה הן, כדי שאתם לא תיפלו. בבדיקה שלי על 200 שאילתות בעברית מול corpus של פוליסות ביטוח, Cohere v3 ניצח את OpenAI ב-recall@5 בכ-4 נקודות אחוז. אם המסמך הוא תקנון משפטי, חתכו לפי סעיפים, לא לפי גודל קבוע. אל תחתכו באמצע פסקה אם אפשר להימנע.

זיכרון, eval, retrieval ו-agents פנימיים שעובדים על מידע רגיש. בניית מערכות פנימיות מתקדמות לארגון שעובדות בין היתר על מודלים מקומיים — בלי לשלם פר-token לכל ספק חיצוני. העבודה נעשית מול כל סוגי הוירטואליזציה וכל ספקי הענן המובילים — ההחלטה הארכיטקטונית מותאמת לעסק שלך — לא לכלים שמוכרים לך. עם human handoff חכם, זיכרון רב-שכבתי — ובכלל זה גם סוכני Voice שעובדים דרך טלפון (TTS עם Gemini 3.1) לביצוע משימות אמיתיות בשיחה חיה.