AI, Kamera Pintar, Kawalan kualiti, OCR mendalam, Pemprosesan imej industri, Pengelasan, Sensor penglihatan

Teknologi AI yang manakah digunakan dalam pemprosesan imej perindustrian?

Bagaimana kecerdasan buatan merevolusikan kawalan kualiti perindustrian

Kecerdasan Buatan (AI) bukan lagi teknologi masa hadapan – ia merupakan bahagian penting dalam sistem pemprosesan imej perindustrian moden. Daripada kawalan kualiti dan pengesanan kecacatan kepada pengecaman aksara optik: Kaedah yang disokong AI membolehkan tugasan visual yang kompleks diselesaikan dengan andal, cepat dan automatik.

Tetapi teknologi AI khusus yang manakah digunakan? Dan bagaimana ia berbeza dari segi fungsi dan bidang aplikasinya?

1. Pengelasan

Asas setiap analisis imej yang disokong AI

Semasa pengelasan, imej atau bahagian imej diberikan kepada satu atau lebih kelas yang telah ditetapkan. Oleh itu, AI mengenali “apa” yang kelihatan dalam imej – contohnya, objek tertentu, kategori komponen atau keadaan kesalahan.

Perbezaan dibuat antara pengelasan berbilang kelas dan berbilang label :

Pengelasan berbilang kelas

Pengelasan skru berbilang kelas — Pengelasan: Pelbagai Kelas

Di sini, setiap imej hanya boleh diberikan kepada satu kelas .
Contoh:

Pengecaman objek: “skru”
Pengelasan ralat: “OK” (tiada kecacatan) atau “NOK” (cacat)

Kelas-kelas tersebut saling eksklusif. Skru tidak boleh menjadi “OK” dan “NOK” pada masa yang sama.

Pengelasan jenis ini kerap digunakan dalam kawalan kualiti atau tugasan pengisihan di mana tugasan yang jelas diperlukan.

Pengelasan berbilang label

Pengelasan skru berbilang label — Pengelasan: Berbilang label

Sebaliknya, dalam pengelasan berbilang label, imej boleh tergolong dalam beberapa kelas secara serentak .
Contoh:

Pengecaman objek: “skru” dan “paku”
Klasifikasi kecacatan: “Kemek” dan “Calar”

Oleh kerana ciri-ciri ini tidak saling eksklusif, sesuatu objek boleh mempamerkan beberapa jenis kecacatan secara serentak.
Kaedah ini sesuai untuk analisis kualiti yang kompleks di mana pelbagai ciri atau kecacatan perlu dikesan secara selari .

2. Pengecaman Objek

Di mana objek berada – bukan sekadar apa sebenarnya objek itu.

Walaupun pengelasan menilai keseluruhan imej, pengesanan objek melangkah lebih jauh: ia mengesan berbilang objek dalam imej , menempatkannya dan memberikan setiap satunya kelas.

Kedudukan-kedudukan tersebut diterangkan oleh apa yang dipanggil kotak sempadan . Setiap kotak menandakan lokasi objek dan kategori mana ia tergolong.

Terdapat dua jenis:

Pengesanan objek selari paksi

Kotak sempadan diselaraskan selari dengan paksi imej . Kaedah ini cekap dari segi pengiraan dan sesuai untuk objek piawai dengan orientasi yang jelas.

Pengecaman objek berorientasikan

Di sini, kotak sempadan dilaraskan kepada orientasi sebenar objek. Ini membolehkan objek yang terletak pada sudut atau berputar dikesan dengan tepat – satu kelebihan utama untuk aplikasi dengan kedudukan berubah-ubah, seperti komponen pada tali sawat.

Pengecaman objek amat berguna untuk tugas-tugas seperti:

Komponen pengiraan dan kedudukan
Mengesan penyimpangan kedudukan
Pengisihan dan pembungkusan automatik

Pengecaman objek berkuasa AI dengan kotak sempadan — Pengecaman objek untuk kedudukan dan pengenalpastian

3. Segmentasi

Analisis tepat piksel untuk ketepatan maksimum

Segmentasi komponen dan kawasan kecacatan yang tepat piksel — Segmentasi untuk ketepatan perincian maksimum

Segmentasi merupakan peringkat analisis imej yang disokong AI yang paling halus. Di sini, bukan sahaja objek dikenali secara keseluruhan, malah setiap piksel individu dalam imej diberikan kelas.

Hasilnya: Penentuan tepat objek, kawasan dan zon ralat.
Contoh:

Pemisahan “skru”, “paku” dan “latar belakang”
Pengesanan kecacatan cat kecil, calar atau pencemaran

Kaedah ini amat cekap apabila ketepatan perincian diperlukan – contohnya dalam pemeriksaan permukaan , ujian jahitan kimpalan atau kawalan kualiti optik salutan dan filem.

4. Aplikasi khas: OCR mendalam dan model AI lain

Apabila penglihatan mesin menjadi bacaan

Selain model yang telah ditetapkan untuk pengelasan, pengecaman objek dan segmentasi, semakin banyak syarikat bergantung pada model AI terlatih khusus aplikasi .

Satu contohnya ialah pengecaman aksara optik (OCR) menggunakan pembelajaran mendalam – singkatan daripada Deep OCR .

Walaupun sistem OCR tradisional bergantung pada fon yang berstruktur dengan jelas dan latar belakang yang seragam, Deep OCR menggunakan rangkaian saraf mendalam yang dilatih pada sejumlah besar imej teks dunia sebenar . Ini membolehkan sistem untuk:

Mengenal huruf dan nombor dengan saiz fon yang berubah-ubah
Membaca teks pada permukaan yang tidak rata atau berkilat
Malah mentafsir cetakan yang rosak atau diubah suai dengan betul

Teknologi ini merupakan satu pencapaian penting untuk aplikasi seperti:

Membaca label, kod bar dan nombor siri
Pengesahan pengenalpastian kelompok
Kebolehkesanan dalam pengeluaran

Kesimpulan

AI menjadikan pemprosesan imej perindustrian lebih pintar, lebih tepat dan lebih fleksibel.

Integrasi kecerdasan buatan ke dalam pemprosesan imej perindustrian membolehkan senario aplikasi yang serba baharu.

Pengelasan mengenal pasti apa itu objek.
Pengecaman objek menentukan di mana ia berada.
Segmentasi memisahkannya daripada latar belakang dengan ketepatan piksel yang sempurna .
OCR mendalam membaca apa yang tertulis di atasnya.

Kamera pintar dan sensor penglihatan moden, yang telah mengintegrasikan algoritma penilaian yang disokong AI, membolehkan proses direka bentuk dengan lebih pantas, lebih andal dan lebih adaptif .