천차만별 PCB도면 표기 AI로 인식해 오차 줄이고 생산성 높여
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
강상기의 산업지능화로 가는 길<4>PCB 설계 도면 인식 자동화 사례
한양대 AI솔루션센터는 기업들에 맞춤형 인공지능(AI) 기술을 제공하는 국내 최초의 전문 AI연구소로, 센터에서 진행한 지능화 구축 성공사례를 시리즈로 소개하고 있다. 이번에 네 번째로 소개할 성공 사례는 수작업 데이터 입력 업무를 AI 모델을 적용, 데이터의 추출 및 입력 자동화로 수작업에 따른 생산력 저하 및 데이터 오입력 리스크를 개선한 PCB전문 업체 이야기다.
수천 개의 정보가 섞인 설계도면에서 목표로 하는 일부분의 제조정보만을 추출하기 위해 다음과 같은 작업을 거쳤다. 단어의 경우, 도면상의 모든 문자와 위치를 다 읽어 들인 후 단어 단위로 분리하고, 주변 단어의 상대적인 위치와 의미로부터 상황을 인지하여 필요한 정보만을 추출하는 ‘위치 및 의미 기반’ 텍스트 정보추출 모델을 개발하였다. 동시에 도면을 그림파일로 변환한 후, 딥러닝 기반 영상 객체인식 기술을 적용하여 각 객체 (특히 표와 특정한 형태의 인식마크)의 형태와 상대적인 배치, 크기로부터 필요한 제조정보를 추정하는 그림 인식 인공지능모델을 개발하였다. 최종적으로 텍스트와 그림 인식 모델의 출력을 조합하여 목표로 하는 제조정보를 추출할 수 있었다. 이는 도면 설계자가 설계 도면을 생성할 때, 도면에 싣는 각 정보의 배치 및 순서에 대한 기본적인 규칙을 따르며, 이러한 기본적인 규칙에서 벗어날 때는 주변 객체 (문자 혹은 그림)의 위치나 Context로부터 추정할 수 있다는 가정에서 출발한 것이다. 결과적으로 수백 개의 도면에 적용한 결과 모두 정확하게 추출할 수 있었다.
이러한 데이터의 인식, 추출에 대한 지능화 모델을 성공적으로 도입, 적용하기 위해서는 데이터의 신뢰성 확보가 무엇보다 중요하다. 때문에 도면에 대한 면밀한 검토가 필요하고, 추출된 데이터는 100% 신뢰할 수 있어야 한다. 모든 항목에 대해 100% 정확도로 인식할 수 있다면 좋겠지만 현실적으로 100%를 만족할 수는 없다. 따라서 정확도가 99.99%이어도 0.01%의 오류 데이터 때문에 제품의 품질이 떨어질 수 있다는 점을 감안해야 한다. 인식 오류가 발생할 경우 담당자가 즉시 인지해 육안으로 재검사할 수 있도록 하고, 수작업으로 입력할 수 있게 하는 것이 최선의 방법일 수 있다.
데이터 인식, 추출에 대한 지능화 모델은 PCB 도면 뿐만 아니라 유통업, 제조업 및 건설업, 보험사 업무 등 다양한 분야에 활용 될 수 있을 것으로 기대된다.
<강상기 한양대 AI솔루션센터장>
사례: PCB 설계 도면 인식 자동화 실현
반도체 및 스마트폰용 PCB 제품 생산 회사인 B社는 PCB 제품 생산 업체다. 발주 업체로부터 PCB 제품 생산에 필요한 도면을 전달받고 이 도면에 명시된 항목별 사양으로 제품을 설계하고 생산을 한다. 문제는 도면에 대한 표준화가 되어 있지 않다는 점이다. 발주 업체나 도면 작성 담당자에 따라 도면 유형이나 항목별 명시 방법이 다 다른 탓에, 육안으로 도면 글자를 인식하여 MES에 데이터를 직접 입력하는 불편함을 감수하고 있었다. 복잡한 도면에서 작은 글씨로 된 수백 개의 문자를 인식하는 수작업 업무는 많은 업무 부하가 걸리는 일이다. 뿐만 아니라 육안 인식 시 발생하는 인식 오류로 데이터 신뢰성 문제가 불거지고, 결국 생산 업무에 많은 차질을 겪었다. 발주 업체별 도면의 비정형성, 비표준화를 통합해 자동 입력될 수 있는 범용 모델이 필요했다. 이에 센터는 PCB 도면 인식 자동화에 대한 연구에 착수, 불량률 감소 및 업무시간을 대폭 절감할 수 있는 지능화 모델을 개발하게 되었다.도면 항목 자동 추출·입력…불량률 감소 및 생산성 향상
PCB 설계 도면은 수 천개의 설계항목으로 구성되어 있다. 이 중에 제조 공정에 사용되는 데이터에는 다양한 텍스트, 표, 이미지 형태로 약 400여 개의 필수 제조 정보가 포함되어 있다. B社는 이전에 전통적인 OCR (Optical Character Recognition) 기술에 기반한 제조정보 인식 기술을 시도하였다. 그러나 문자와 그림의 겹침에 의한 인식 오류, 작은 글씨 및 폰트의 다양성에 의한 인식 오류 등에 따라 인식 정확도가 떨어져, 대상 항목에 대한 100%의 인식 정확도를 요구하는 정밀 공정에서 사용은 무리라고 판단하고 있었다.수천 개의 정보가 섞인 설계도면에서 목표로 하는 일부분의 제조정보만을 추출하기 위해 다음과 같은 작업을 거쳤다. 단어의 경우, 도면상의 모든 문자와 위치를 다 읽어 들인 후 단어 단위로 분리하고, 주변 단어의 상대적인 위치와 의미로부터 상황을 인지하여 필요한 정보만을 추출하는 ‘위치 및 의미 기반’ 텍스트 정보추출 모델을 개발하였다. 동시에 도면을 그림파일로 변환한 후, 딥러닝 기반 영상 객체인식 기술을 적용하여 각 객체 (특히 표와 특정한 형태의 인식마크)의 형태와 상대적인 배치, 크기로부터 필요한 제조정보를 추정하는 그림 인식 인공지능모델을 개발하였다. 최종적으로 텍스트와 그림 인식 모델의 출력을 조합하여 목표로 하는 제조정보를 추출할 수 있었다. 이는 도면 설계자가 설계 도면을 생성할 때, 도면에 싣는 각 정보의 배치 및 순서에 대한 기본적인 규칙을 따르며, 이러한 기본적인 규칙에서 벗어날 때는 주변 객체 (문자 혹은 그림)의 위치나 Context로부터 추정할 수 있다는 가정에서 출발한 것이다. 결과적으로 수백 개의 도면에 적용한 결과 모두 정확하게 추출할 수 있었다.
이러한 데이터의 인식, 추출에 대한 지능화 모델을 성공적으로 도입, 적용하기 위해서는 데이터의 신뢰성 확보가 무엇보다 중요하다. 때문에 도면에 대한 면밀한 검토가 필요하고, 추출된 데이터는 100% 신뢰할 수 있어야 한다. 모든 항목에 대해 100% 정확도로 인식할 수 있다면 좋겠지만 현실적으로 100%를 만족할 수는 없다. 따라서 정확도가 99.99%이어도 0.01%의 오류 데이터 때문에 제품의 품질이 떨어질 수 있다는 점을 감안해야 한다. 인식 오류가 발생할 경우 담당자가 즉시 인지해 육안으로 재검사할 수 있도록 하고, 수작업으로 입력할 수 있게 하는 것이 최선의 방법일 수 있다.
데이터 인식, 추출에 대한 지능화 모델은 PCB 도면 뿐만 아니라 유통업, 제조업 및 건설업, 보험사 업무 등 다양한 분야에 활용 될 수 있을 것으로 기대된다.
<강상기 한양대 AI솔루션센터장>