เทคโนโลยี AI ใดบ้างที่ใช้ในการประมวลผลภาพในภาคอุตสาหกรรม?

ปัญญาประดิษฐ์กำลังปฏิวัติการควบคุมคุณภาพในอุตสาหกรรมอย่างไร

ปัญญาประดิษฐ์ (AI) ไม่ใช่เทคโนโลยีแห่งอนาคตอีกต่อไป แต่เป็นส่วนสำคัญของระบบประมวลผลภาพในอุตสาหกรรมสมัยใหม่ ตั้งแต่การควบคุมคุณภาพและการตรวจจับข้อบกพร่อง ไปจนถึงการรู้จำอักษรด้วยแสง (OCR): วิธีการที่ใช้ AI ช่วยให้สามารถแก้ไขงานด้านภาพที่ซับซ้อนได้อย่างน่าเชื่อถือ รวดเร็ว และอัตโนมัติ

แต่ใช้เทคโนโลยี AI ใดบ้าง และเทคโนโลยีเหล่านั้นแตกต่างกันอย่างไรในด้านฟังก์ชันการทำงานและขอบเขตการใช้งาน?

การประมวลผลภาพทางอุตสาหกรรมด้วยการสนับสนุนจาก AI
ปัญญาประดิษฐ์ในการประมวลผลภาพทางอุตสาหกรรม

1. การจำแนกประเภท

รากฐานของการวิเคราะห์ภาพที่ได้รับการสนับสนุนจาก AI ทุกรูปแบบ

ในระหว่าง การจำแนก ประเภท ภาพหรือส่วนของภาพจะถูกกำหนดให้กับคลาสที่กำหนดไว้ล่วงหน้าอย่างน้อยหนึ่งคลาส ปัญญาประดิษฐ์จึงสามารถจดจำ “สิ่งที่” ปรากฏให้เห็นในภาพได้ เช่น วัตถุเฉพาะ ประเภทของส่วนประกอบ หรือสภาวะความผิดปกติ

มีการแยกความแตกต่างระหว่างการจำแนก ประเภทแบบหลายคลาส และ การจำแนกประเภทแบบหลายป้ายกำกับ :

การจำแนกประเภทหลายคลาส

การจำแนกประเภทสกรูแบบหลายประเภท
การจำแนกประเภท: หลายคลาส

ในที่นี้ รูปภาพแต่ละรูปสามารถ กำหนดให้กับคลาสเดียวเท่านั้น
ตัวอย่าง:

  • การจดจำวัตถุ: “สกรู”
  • การจำแนกประเภทข้อผิดพลาด: “OK” (ไม่มีข้อบกพร่อง) หรือ “NOK” (มีข้อบกพร่อง)


ประเภทของสกรูนั้นแยกออกจากกันโดยสิ้นเชิง สกรูตัวหนึ่งไม่สามารถเป็นได้ทั้ง “ใช้ได้” และ “ใช้ไม่ได้” ในเวลาเดียวกัน

การจำแนกประเภทแบบนี้มักใช้ใน งาน ควบคุมคุณภาพ หรือการคัดแยกที่ต้องการการกำหนดอย่างชัดเจน

การจำแนกประเภทหลายป้ายกำกับ

การจำแนกประเภทสกรูแบบหลายป้ายกำกับ
การจำแนกประเภท: หลายป้ายกำกับ

ในทางตรงกันข้าม ในการจำแนกประเภทแบบหลายป้ายกำกับ ภาพหนึ่งภาพสามารถอยู่ ในหลายคลาสพร้อมกันได้
ตัวอย่าง:

  • การจำแนกวัตถุ: “สกรู” และ “ตะปู”
  • การจำแนกประเภทความเสียหาย: “รอยบุบ” และ “รอยขีดข่วน”

เนื่องจากลักษณะเหล่านี้ไม่ได้ขัดแย้งกัน วัตถุชิ้นหนึ่งจึงอาจแสดงข้อบกพร่องหลายประเภทพร้อมกันได้
วิธีนี้เหมาะอย่างยิ่งสำหรับการวิเคราะห์คุณภาพที่ซับซ้อน ซึ่ง จำเป็นต้องตรวจจับคุณลักษณะหรือข้อบกพร่องหลายอย่างพร้อมกัน

2. การจดจำวัตถุ

พิจารณาจากตำแหน่งที่ตั้งของวัตถุ ไม่ใช่แค่ว่าวัตถุเหล่านั้นคืออะไร

ในขณะที่การจำแนกประเภทประเมินภาพทั้งหมด การตรวจจับวัตถุ จะก้าวไปอีกขั้น: มันตรวจจับ วัตถุหลายชิ้นในภาพ ระบุตำแหน่งของวัตถุเหล่านั้น และกำหนดคลาสให้กับแต่ละวัตถุ

ตำแหน่งต่างๆ จะถูกอธิบายด้วย กรอบสี่เหลี่ยม ที่เรียกว่า “กรอบล้อมรอบ” แต่ละกรอบจะระบุ ตำแหน่งที่ตั้ง ของวัตถุและจัดอยู่ใน หมวดหมู่ใด

มีสองประเภท:

การตรวจจับวัตถุขนานแกน

กรอบสี่เหลี่ยมที่ล้อมรอบวัตถุจะวางตัว ขนานกับแกนของภาพ วิธีนี้มีประสิทธิภาพในการคำนวณและเหมาะสมอย่างยิ่งสำหรับวัตถุมาตรฐานที่มีทิศทางชัดเจน

การจดจำวัตถุแบบมีทิศทาง

ในที่นี้ กรอบสี่เหลี่ยมที่ใช้กำหนดขอบเขตจะถูกปรับให้ เข้ากับทิศทางที่แท้จริง ของวัตถุ ซึ่งช่วยให้สามารถตรวจจับ วัตถุที่วางเอียงหรือหมุน ได้อย่างแม่นยำ นับเป็นข้อได้เปรียบที่สำคัญสำหรับแอปพลิเคชันที่มีตำแหน่งเปลี่ยนแปลงได้ เช่น ชิ้นส่วนบนสายพานลำเลียง

การจดจำวัตถุมีประโยชน์อย่างยิ่งสำหรับงานต่างๆ เช่น:

  • การนับและจัดวางส่วนประกอบ
  • การตรวจจับความเบี่ยงเบนของตำแหน่ง
  • การคัดแยกและบรรจุภัณฑ์อัตโนมัติ
การจดจำวัตถุด้วย AI พร้อมกรอบขอบเขต
การจดจำวัตถุเพื่อระบุตำแหน่งและลักษณะเฉพาะ

3. การแบ่งส่วน

การวิเคราะห์ที่แม่นยำระดับพิกเซลเพื่อความถูกต้องสูงสุด

การแบ่งส่วนองค์ประกอบและพื้นที่บกพร่องอย่างแม่นยำระดับพิกเซล
การแบ่งส่วนเพื่อความแม่นยำของรายละเอียดสูงสุด

การแบ่งส่วนภาพ (Segmentation) เป็นขั้นตอนที่ละเอียดที่สุดของการวิเคราะห์ภาพด้วย AI ในขั้นตอนนี้ ไม่เพียงแต่จะจดจำวัตถุโดยรวมเท่านั้น แต่ แต่ละพิกเซล ในภาพยังได้รับการกำหนดคลาสอีกด้วย

ผลลัพธ์: การกำหนดขอบเขตของวัตถุ พื้นที่ และโซนความคลาดเคลื่อนได้อย่างแม่นยำ
ตัวอย่าง:

  • การแยก “สกรู” “ตะปู” และ “พื้นหลัง”
  • การตรวจจับ ตำหนิเล็กน้อย รอยขีดข่วน หรือสิ่งปนเปื้อนในสี


วิธีนี้มีประสิทธิภาพเป็นพิเศษเมื่อต้องการ ความแม่นยำในรายละเอียด เช่น ใน การตรวจสอบพื้นผิว การทดสอบรอยเชื่อม หรือ การควบคุมคุณภาพทางแสง ของสารเคลือบและฟิล์ม

4. การใช้งานเฉพาะด้าน: Deep OCR และโมเดล AI อื่นๆ

เมื่อระบบประมวลผลภาพกลายเป็นระบบการอ่าน

นอกเหนือจากโมเดลที่ได้รับการยอมรับสำหรับการจำแนกประเภท การจดจำวัตถุ และการแบ่งส่วนแล้ว บริษัทต่างๆ ยังหันมาใช้ โมเดล AI ที่ได้รับการฝึกฝนเฉพาะด้านสำหรับการใช้งานแต่ละประเภท มากขึ้นเรื่อยๆ

ตัวอย่างหนึ่งคือ การรู้จำอักษรด้วยแสง (OCR) โดยใช้ การเรียนรู้เชิงลึก หรือเรียกสั้น ๆ ว่า Deep OCR

ในขณะที่ระบบ OCR แบบดั้งเดิมอาศัยแบบอักษรที่มีโครงสร้างชัดเจนและพื้นหลังที่เป็นมาตรฐานเดียวกัน แต่ Deep OCR ใช้ เครือข่ายประสาทเทียมเชิงลึก ที่ได้รับการฝึกฝนด้วย ภาพข้อความจริงจำนวนมาก ซึ่งทำให้ระบบสามารถ:

  • การจดจำตัวอักษรและตัวเลขที่มีขนาดตัวอักษรแปรผันได้
  • การอ่านข้อความบน พื้นผิวที่ไม่เรียบหรือมันวาว
  • แม้กระทั่งการตีความภาพ พิมพ์ที่เสียหายหรือเปลี่ยนแปลงไป อย่างถูกต้อง

เทคโนโลยีนี้ถือเป็นก้าวสำคัญสำหรับการใช้งานในด้านต่างๆ เช่น:

  • การอ่านฉลาก บาร์โค้ด และหมายเลขประจำเครื่อง
  • การตรวจสอบรหัสล็อต
  • การตรวจสอบย้อนกลับในกระบวนการผลิต

บทสรุป

AI ทำให้การประมวลผลภาพในภาคอุตสาหกรรมฉลาดขึ้น แม่นยำขึ้น และยืดหยุ่นมากขึ้น

การบูรณา การปัญญาประดิษฐ์ เข้ากับการประมวลผลภาพในอุตสาหกรรม ทำให้เกิดสถานการณ์การใช้งานใหม่ๆ อย่างที่ไม่เคยมีมาก่อน

  • การจำแนกประเภท ระบุว่าวัตถุนั้นคือ อะไร
  • การจดจำวัตถุ จะระบุ ตำแหน่งที่ตั้ง ของวัตถุนั้น
  • การแบ่งส่วนภาพ จะแยกภาพออกจากพื้นหลัง ด้วยความแม่นยำระดับพิกเซล
  • OCR ขั้นสูง จะอ่าน สิ่งที่เขียนอยู่บนนั้น

กล้องอัจฉริยะและเซ็นเซอร์ตรวจจับภาพสมัยใหม่ ซึ่งได้รวมเอาอัลกอริธึมการประเมินผลที่ใช้ AI ไว้แล้ว ช่วยให้สามารถออกแบบกระบวนการต่างๆ ได้เร็วขึ้น น่าเชื่อถือมากขึ้น และปรับตัวได้ดียิ่งขึ้น

ผู้เขียน

Picture of แม็กซ์ มัสเตอร์มันน์

แม็กซ์ มัสเตอร์มันน์

ชื่อตำแหน่ง