Abstract תמצית
יכולת עקיבה אחר אובייקטים נעים [מקור 10] נדרשת היום יותר מתמיד בתחום הראיה הממוחשבת (Computer Vision) למטרות פיקוח [מקור 9], תעשייה, דחיסת תמונה [מקור 11], רפואה וכדו'.
האתגרים הבסיסיים, שהביאו רבים לחקור תחום זה, הנם ההתמודדות עם כמות נתונים עצומה בתדירות גבוהה, תוך כדי שמירה על רזולוציות התמונה, מציאת אלגוריתם בעל סיבוכיות נמוכה דיה עד לכדי Real Time.
פרוייקט זה של ראייה ממוחשבת, נועד לבנות מודל לעקיבה אוטומטית, על-סמך זיהוי אובייקט, בסביבה שאינה מלאכותית.
העבודה התמקדה בתוכנית לדגימה, סריקה וניתוח תמונות לשם זיהוי המטרה, תוך דגש על שלושה אתגרים מרכזיים:
זיהוי המטרה: הזיהוי בתמונה המתקבלת ממצלמה הנמצאת בתנועה בעזרת טכניקות ידועות ובעלות סיבוכיות נמוכה של ראייה ממוחשבת, כגון: זיהוי צבע, אפיוני צורה וגדילת אזור, כך שבסיום ניתוח התמונה, נוכל לשדר לרובוט פקודות תנועה, המתאימות למיקום האובייקט הנעקב בקצב מספיק מהיר על מנת שלא יאבד אותו.
הנושא של זיהוי צבע וצורה הוא נושא בעייתי, כאשר מדובר במעקב (כאשר גם המטרה וגם נקודת המבט של המצלמה העוקבת משתנים), שינויי המיקום באזור המעקב וזווית המבט גורמים לשינויים גדולים בהארה ויוצרים החזרות המקשות על זיהוי צבע .
האלגוריתם: האלגוריתם [מקור 7] הממומש בפרויקט זה אינו מבוסס על חישובים סטטיסטיים ותחזיות, אלא מסתמך על שיפוע גרף הצפיפות, במטרה למצוא את נקודת השיא, הנקודה בה הסתברות התפוצה היא הגבוהה ביותר.
במימוש האלגוריתם, השתמשתי בשיטות אדפטיביות, על מנת לקבל דיוק רב יותר.
אינטגרציה: אינטגרציה של מערכת, המורכבת מרכיבי חומרה ותוכנה שונים, שחלקם היו נתונים והכתיבו תנאים ודרכי התממשקות מסוימים, למערכת אחת.
באינטגרציה שכזו, יש לדאוג לא רק להתממשקות נכונה של כל רכיבי המערכת (בעיה סבוכה בפני עצמה), אלא גם לתפקוד מספק של כל אחד ואחד מרכיביה בנפרד, ובכך למנוע "צוואר בקבוק" בפעולת המערכת.
הפרויקט בוצע בחסותה של חברת אומיקרון דלתא בע"מ (נציגת MATLAB בישראל) ובשילוב עם Lego MindStorm . הוא ממומש באמצעות רובוט לגו, המצויד במצלמה ובבקר לגו שמכוון את תנועתו. לב המערכת הוא מחשב PC המקבל את זרם הווידאו, מבצע את פעולות הניתוח והזיהוי, ומשדר פקודות תנועה לרובוט, באמצעות מגדל אינפרא אדום. המודל משלב מגוון מערכות חומרה ותוכנה, בעלות ממשקים שונים, לכדי מערכת מורכבת רבת פונקציות.
האתגרים הבסיסיים, שהביאו רבים לחקור תחום זה, הנם ההתמודדות עם כמות נתונים עצומה בתדירות גבוהה, תוך כדי שמירה על רזולוציות התמונה, מציאת אלגוריתם בעל סיבוכיות נמוכה דיה עד לכדי Real Time.
פרוייקט זה של ראייה ממוחשבת, נועד לבנות מודל לעקיבה אוטומטית, על-סמך זיהוי אובייקט, בסביבה שאינה מלאכותית.
העבודה התמקדה בתוכנית לדגימה, סריקה וניתוח תמונות לשם זיהוי המטרה, תוך דגש על שלושה אתגרים מרכזיים:
זיהוי המטרה: הזיהוי בתמונה המתקבלת ממצלמה הנמצאת בתנועה בעזרת טכניקות ידועות ובעלות סיבוכיות נמוכה של ראייה ממוחשבת, כגון: זיהוי צבע, אפיוני צורה וגדילת אזור, כך שבסיום ניתוח התמונה, נוכל לשדר לרובוט פקודות תנועה, המתאימות למיקום האובייקט הנעקב בקצב מספיק מהיר על מנת שלא יאבד אותו.
הנושא של זיהוי צבע וצורה הוא נושא בעייתי, כאשר מדובר במעקב (כאשר גם המטרה וגם נקודת המבט של המצלמה העוקבת משתנים), שינויי המיקום באזור המעקב וזווית המבט גורמים לשינויים גדולים בהארה ויוצרים החזרות המקשות על זיהוי צבע .
האלגוריתם: האלגוריתם [מקור 7] הממומש בפרויקט זה אינו מבוסס על חישובים סטטיסטיים ותחזיות, אלא מסתמך על שיפוע גרף הצפיפות, במטרה למצוא את נקודת השיא, הנקודה בה הסתברות התפוצה היא הגבוהה ביותר.
במימוש האלגוריתם, השתמשתי בשיטות אדפטיביות, על מנת לקבל דיוק רב יותר.
אינטגרציה: אינטגרציה של מערכת, המורכבת מרכיבי חומרה ותוכנה שונים, שחלקם היו נתונים והכתיבו תנאים ודרכי התממשקות מסוימים, למערכת אחת.
באינטגרציה שכזו, יש לדאוג לא רק להתממשקות נכונה של כל רכיבי המערכת (בעיה סבוכה בפני עצמה), אלא גם לתפקוד מספק של כל אחד ואחד מרכיביה בנפרד, ובכך למנוע "צוואר בקבוק" בפעולת המערכת.
הפרויקט בוצע בחסותה של חברת אומיקרון דלתא בע"מ (נציגת MATLAB בישראל) ובשילוב עם Lego MindStorm . הוא ממומש באמצעות רובוט לגו, המצויד במצלמה ובבקר לגו שמכוון את תנועתו. לב המערכת הוא מחשב PC המקבל את זרם הווידאו, מבצע את פעולות הניתוח והזיהוי, ומשדר פקודות תנועה לרובוט, באמצעות מגדל אינפרא אדום. המודל משלב מגוון מערכות חומרה ותוכנה, בעלות ממשקים שונים, לכדי מערכת מורכבת רבת פונקציות.
Computer vision tracking is an active and developing field. Elaborate methods such astracking contours with snakes [[ 1][ 2][ 3]], using Eigenspace matching techniques [4], maintaining large sets of statistical hypotheses [5], or convolving images with feature detectors [6] are far too computationally expensive. We want a tracker that will track a given object in the presence of noise, other objects, and movements. Moreover, it must run fast and efficiently so that objects may be tracked in real time (~ 30 frames per second) while consuming as few system resources as possible.In other words, this tracker should be able to serve as part of a user interface that is in turn part of the computational tasks that a computer might routinely be expected to carry out. This tracker also needs to run on inexpensive consumer cameras and not require calibrated lenses.The new algorithm implemented here is based on a robust nonparametric techniquefor climbing density gradients to find the mode (peak) of probability distributionscalled the mean shift algorithm. In our case, we want to find the mode of a colordistribution within a video scene. Therefore, the mean shift algorithm is modified todeal with dynamically changing color probability distributions derived from videoframe sequences. The modified algorithm is called the Continuously Adaptive MeanShift (CAMSHIFT) algorithm.CAMSHIFT’s tracking accuracy is compared against a Polhemus tracker. Toleranceto noise, distracters and performance is studied.In my work a Lego® robot with an on- board camera was created. The camera had tosupply a desktop computer with visual data. The computer had to make decisions andsend commands to the Lego® robot according to the data supplied by the camera. Such a system could be very useful in any surveillance application. The system couldbe applied to vehicles that follow targets or leading vehicles without human driverscontrolling them etc. One of the main problems I've encounter was integrating a complex combination ofhardware and software all together into one piece.

1 Comments:
Projekt Legoroboter
http://www.e-technik.fh-kiel.de/~waller/ftp/Projekte/Projekt6.pdf
Post a Comment
<< Home