AI, OCR เชิงลึก, กล้องอัจฉริยะ, การควบคุมคุณภาพ, การจำแนกประเภท, การประมวลผลภาพอุตสาหกรรม, เซ็นเซอร์การมองเห็น

เทคโนโลยี AI ใดบ้างที่ใช้ในการประมวลผลภาพในภาคอุตสาหกรรม?

ปัญญาประดิษฐ์กำลังปฏิวัติการควบคุมคุณภาพในอุตสาหกรรมอย่างไร

ปัญญาประดิษฐ์ (AI) ไม่ใช่เทคโนโลยีแห่งอนาคตอีกต่อไป แต่เป็นส่วนสำคัญของระบบประมวลผลภาพในอุตสาหกรรมสมัยใหม่ ตั้งแต่การควบคุมคุณภาพและการตรวจจับข้อบกพร่อง ไปจนถึงการรู้จำอักษรด้วยแสง (OCR): วิธีการที่ใช้ AI ช่วยให้สามารถแก้ไขงานด้านภาพที่ซับซ้อนได้อย่างน่าเชื่อถือ รวดเร็ว และอัตโนมัติ

แต่ใช้เทคโนโลยี AI ใดบ้าง และเทคโนโลยีเหล่านั้นแตกต่างกันอย่างไรในด้านฟังก์ชันการทำงานและขอบเขตการใช้งาน?

1. การจำแนกประเภท

รากฐานของการวิเคราะห์ภาพที่ได้รับการสนับสนุนจาก AI ทุกรูปแบบ

ในระหว่าง การจำแนก ประเภท ภาพหรือส่วนของภาพจะถูกกำหนดให้กับคลาสที่กำหนดไว้ล่วงหน้าอย่างน้อยหนึ่งคลาส ปัญญาประดิษฐ์จึงสามารถจดจำ “สิ่งที่” ปรากฏให้เห็นในภาพได้ เช่น วัตถุเฉพาะ ประเภทของส่วนประกอบ หรือสภาวะความผิดปกติ

มีการแยกความแตกต่างระหว่างการจำแนก ประเภทแบบหลายคลาส และ การจำแนกประเภทแบบหลายป้ายกำกับ :

การจำแนกประเภทหลายคลาส

การจำแนกประเภทสกรูแบบหลายประเภท — การจำแนกประเภท: หลายคลาส

ในที่นี้ รูปภาพแต่ละรูปสามารถ กำหนดให้กับคลาสเดียวเท่านั้น
ตัวอย่าง:

การจดจำวัตถุ: “สกรู”
การจำแนกประเภทข้อผิดพลาด: “OK” (ไม่มีข้อบกพร่อง) หรือ “NOK” (มีข้อบกพร่อง)

ประเภทของสกรูนั้นแยกออกจากกันโดยสิ้นเชิง สกรูตัวหนึ่งไม่สามารถเป็นได้ทั้ง “ใช้ได้” และ “ใช้ไม่ได้” ในเวลาเดียวกัน

การจำแนกประเภทแบบนี้มักใช้ใน งาน ควบคุมคุณภาพ หรือการคัดแยกที่ต้องการการกำหนดอย่างชัดเจน

การจำแนกประเภทหลายป้ายกำกับ

การจำแนกประเภทสกรูแบบหลายป้ายกำกับ — การจำแนกประเภท: หลายป้ายกำกับ

ในทางตรงกันข้าม ในการจำแนกประเภทแบบหลายป้ายกำกับ ภาพหนึ่งภาพสามารถอยู่ ในหลายคลาสพร้อมกันได้
ตัวอย่าง:

การจำแนกวัตถุ: “สกรู” และ “ตะปู”
การจำแนกประเภทความเสียหาย: “รอยบุบ” และ “รอยขีดข่วน”

เนื่องจากลักษณะเหล่านี้ไม่ได้ขัดแย้งกัน วัตถุชิ้นหนึ่งจึงอาจแสดงข้อบกพร่องหลายประเภทพร้อมกันได้
วิธีนี้เหมาะอย่างยิ่งสำหรับการวิเคราะห์คุณภาพที่ซับซ้อน ซึ่ง จำเป็นต้องตรวจจับคุณลักษณะหรือข้อบกพร่องหลายอย่างพร้อมกัน

2. การจดจำวัตถุ

พิจารณาจากตำแหน่งที่ตั้งของวัตถุ ไม่ใช่แค่ว่าวัตถุเหล่านั้นคืออะไร

ในขณะที่การจำแนกประเภทประเมินภาพทั้งหมด การตรวจจับวัตถุ จะก้าวไปอีกขั้น: มันตรวจจับ วัตถุหลายชิ้นในภาพ ระบุตำแหน่งของวัตถุเหล่านั้น และกำหนดคลาสให้กับแต่ละวัตถุ

ตำแหน่งต่างๆ จะถูกอธิบายด้วย กรอบสี่เหลี่ยม ที่เรียกว่า “กรอบล้อมรอบ” แต่ละกรอบจะระบุ ตำแหน่งที่ตั้ง ของวัตถุและจัดอยู่ใน หมวดหมู่ใด

มีสองประเภท:

การตรวจจับวัตถุขนานแกน

กรอบสี่เหลี่ยมที่ล้อมรอบวัตถุจะวางตัว ขนานกับแกนของภาพ วิธีนี้มีประสิทธิภาพในการคำนวณและเหมาะสมอย่างยิ่งสำหรับวัตถุมาตรฐานที่มีทิศทางชัดเจน

การจดจำวัตถุแบบมีทิศทาง

ในที่นี้ กรอบสี่เหลี่ยมที่ใช้กำหนดขอบเขตจะถูกปรับให้ เข้ากับทิศทางที่แท้จริง ของวัตถุ ซึ่งช่วยให้สามารถตรวจจับ วัตถุที่วางเอียงหรือหมุน ได้อย่างแม่นยำ นับเป็นข้อได้เปรียบที่สำคัญสำหรับแอปพลิเคชันที่มีตำแหน่งเปลี่ยนแปลงได้ เช่น ชิ้นส่วนบนสายพานลำเลียง

การจดจำวัตถุมีประโยชน์อย่างยิ่งสำหรับงานต่างๆ เช่น:

การนับและจัดวางส่วนประกอบ
การตรวจจับความเบี่ยงเบนของตำแหน่ง
การคัดแยกและบรรจุภัณฑ์อัตโนมัติ

การจดจำวัตถุด้วย AI พร้อมกรอบขอบเขต — การจดจำวัตถุเพื่อระบุตำแหน่งและลักษณะเฉพาะ

3. การแบ่งส่วน

การวิเคราะห์ที่แม่นยำระดับพิกเซลเพื่อความถูกต้องสูงสุด

การแบ่งส่วนองค์ประกอบและพื้นที่บกพร่องอย่างแม่นยำระดับพิกเซล — การแบ่งส่วนเพื่อความแม่นยำของรายละเอียดสูงสุด

การแบ่งส่วนภาพ (Segmentation) เป็นขั้นตอนที่ละเอียดที่สุดของการวิเคราะห์ภาพด้วย AI ในขั้นตอนนี้ ไม่เพียงแต่จะจดจำวัตถุโดยรวมเท่านั้น แต่ แต่ละพิกเซล ในภาพยังได้รับการกำหนดคลาสอีกด้วย

ผลลัพธ์: การกำหนดขอบเขตของวัตถุ พื้นที่ และโซนความคลาดเคลื่อนได้อย่างแม่นยำ
ตัวอย่าง:

การแยก “สกรู” “ตะปู” และ “พื้นหลัง”
การตรวจจับ ตำหนิเล็กน้อย รอยขีดข่วน หรือสิ่งปนเปื้อนในสี

วิธีนี้มีประสิทธิภาพเป็นพิเศษเมื่อต้องการ ความแม่นยำในรายละเอียด เช่น ใน การตรวจสอบพื้นผิว การทดสอบรอยเชื่อม หรือ การควบคุมคุณภาพทางแสง ของสารเคลือบและฟิล์ม

4. การใช้งานเฉพาะด้าน: Deep OCR และโมเดล AI อื่นๆ

เมื่อระบบประมวลผลภาพกลายเป็นระบบการอ่าน

นอกเหนือจากโมเดลที่ได้รับการยอมรับสำหรับการจำแนกประเภท การจดจำวัตถุ และการแบ่งส่วนแล้ว บริษัทต่างๆ ยังหันมาใช้ โมเดล AI ที่ได้รับการฝึกฝนเฉพาะด้านสำหรับการใช้งานแต่ละประเภท มากขึ้นเรื่อยๆ

ตัวอย่างหนึ่งคือ การรู้จำอักษรด้วยแสง (OCR) โดยใช้ การเรียนรู้เชิงลึก หรือเรียกสั้น ๆ ว่า Deep OCR

ในขณะที่ระบบ OCR แบบดั้งเดิมอาศัยแบบอักษรที่มีโครงสร้างชัดเจนและพื้นหลังที่เป็นมาตรฐานเดียวกัน แต่ Deep OCR ใช้ เครือข่ายประสาทเทียมเชิงลึก ที่ได้รับการฝึกฝนด้วย ภาพข้อความจริงจำนวนมาก ซึ่งทำให้ระบบสามารถ:

การจดจำตัวอักษรและตัวเลขที่มีขนาดตัวอักษรแปรผันได้
การอ่านข้อความบน พื้นผิวที่ไม่เรียบหรือมันวาว
แม้กระทั่งการตีความภาพ พิมพ์ที่เสียหายหรือเปลี่ยนแปลงไป อย่างถูกต้อง

เทคโนโลยีนี้ถือเป็นก้าวสำคัญสำหรับการใช้งานในด้านต่างๆ เช่น:

การอ่านฉลาก บาร์โค้ด และหมายเลขประจำเครื่อง
การตรวจสอบรหัสล็อต
การตรวจสอบย้อนกลับในกระบวนการผลิต

บทสรุป

AI ทำให้การประมวลผลภาพในภาคอุตสาหกรรมฉลาดขึ้น แม่นยำขึ้น และยืดหยุ่นมากขึ้น

การบูรณา การปัญญาประดิษฐ์ เข้ากับการประมวลผลภาพในอุตสาหกรรม ทำให้เกิดสถานการณ์การใช้งานใหม่ๆ อย่างที่ไม่เคยมีมาก่อน

การจำแนกประเภท ระบุว่าวัตถุนั้นคือ อะไร
การจดจำวัตถุ จะระบุ ตำแหน่งที่ตั้ง ของวัตถุนั้น
การแบ่งส่วนภาพ จะแยกภาพออกจากพื้นหลัง ด้วยความแม่นยำระดับพิกเซล
OCR ขั้นสูง จะอ่าน สิ่งที่เขียนอยู่บนนั้น

กล้องอัจฉริยะและเซ็นเซอร์ตรวจจับภาพสมัยใหม่ ซึ่งได้รวมเอาอัลกอริธึมการประเมินผลที่ใช้ AI ไว้แล้ว ช่วยให้สามารถออกแบบกระบวนการต่างๆ ได้เร็วขึ้น น่าเชื่อถือมากขึ้น และปรับตัวได้ดียิ่งขึ้น