[신철수 쌤의 국어 지문 읽기] 동일한 등가 비교 연산의 반복, 여럿 중 하나 고르기
입력
수정
지면S20
(76) 동일한 과정의 반복
서로 다른 경계 상자에서 같은 종류의 객체가 탐지될 수 있다. 이때는 각 경계 상자가 하나의 대상에 중복되어 표시된 것인지, 서로 다른 대상에 표시된 것인지를 판단하여 이미지 속의 각 대상별로 가장 정확한 경계 상자 하나만 표시하는 과정을 거치는데, 이를 ‘비최댓값 억제(NMS, Non-Max Suppression)’라고 한다. NMS는 두 경계 상자의 교집합을 합집합으로 나눈 값인 IoU를 기준으로 이루어진다. IoU 값은 두 경계 상자의 위치가 일치할수록 1에 가까운 값이 나오며, 이 값이 설정된 임곗값보다 크면 두 경계 상자가 동일한 대상에 표시된 것으로 판단하고 둘 중 신뢰도 점수가 낮은 상자를 삭제한다. 그리고 IoU 값이 설정된 임곗값보다 작으면 경계 상자가 서로 다른 대상에 표시된 것으로 판단하여 두 경계 상자 모두 그대로 둔다. 이러한 방법으로 한 가지 종류의 객체에 대해 그려진 모든 경계 상자들 중 가장 높은 신뢰도 점수를 가진 경계 상자를 기준으로 다른 경계 상자들을 하나씩 삭제해 나간다. 이후 IoU 값이 설정된 임곗값보다 작아서 지워지지 않고 남겨진 경계 상자 중에서 가장 높은 신뢰도 점수를 가진 경계 상자를 다음 기준으로 정하여 동일한 과정을 반복한다. 그리고 이러한 과정을 다른 모든 대상에 표시된 경계 상자들에 대해서도 순차적으로 반복한다. 이렇게 해서 결국 이미지 속의 각 대상별로 가장 높은 신뢰도 점수를 가진 경계 상자 하나씩만 남게 된다.
-2022학년도 7월 교육청 전국연합학력평가-
서로 다른 경계 상자에서 같은 종류의 객체가 탐지…각 경계 상자가 하나의 대상에 중복되어 표시… 서로 다른 대상에 표시… 각 대상별로 가장 정확한 경계 상자 하나만 표시하는 과정
‘문제 발생의 원인-문제 상황-문제 해결 방법-문제 해결 결과’ 등으로 나눠 글을 이해하는 연습을 많이 하라 했다. 지문에서도 ‘서로 다른 경계 상자에서 같은 종류의 객체가 탐지’된 것이 해결할 문제 상황이다. 이 문제를 해결한 결과는 ‘각 대상별로 가장 정확한 경계 상자 하나만 표시하’는 것인데, 이를 위해 ‘과정’이라는 해결 방법을 거친다.그런데 지문에는 문제 상황을 구체화하고 있다. 즉 ‘각 경계 상자가 하나의 대상에 중복되어 표시’된 경우와 ‘서로 다른 대상에 표시’된 경우를 말하고 있는데, 해결 결과를 고려할 때 앞의 경우만 문제가 되는 것이다.
경우의 수를 따지는 수학적 사고가 있다. 옆의 도식처럼 ‘같은 종류의 객체’에 ‘하나의 대상’인 경우와 ‘서로 다른 대상’인 경우가 있다는 것을 떠올리는 것이 그 사례다. 이런 경우의 수를 생각할 때 구체화하며 글을 읽을 수 있다는 것을 명심해야 한다.
두 경계 상자의 교집합을 합집합으로 나눈 값 … 두 경계 상자의 위치가 일치할수록 1에 가까운 값
집합, 대수(代數), 함수, 기하와 관련한 수학적 사고를 복합적으로 하며 읽어야 하는 글이 있다. 지문에 ‘교집합’과 ‘합집합’ ‘나눈 값’ ‘두 경계 상자의 위치가 일치할수록 1에 가까운’ 등은 그 사례다.집합, 기하 개념을 활용해 위 그림과 같이 이해하고, 대수 개념을 활용해 다음과 같은 식을 떠올려야 한다.이제 우리가 떠올려야 할 것이 함수다. 경계 상자1과 경계 상자2의 크기에 변화가 없다면, 교집합 A의 크기가 클수록 상자가 겹치는 부분이 커진다. 이후 우리는 기하학적 사고를 해야 한다. 겹치는 부분의 크기는 얼마가 최대일까? 작은 경계 상자의 크기까지만 커진다. 그때까지는 분모와 분자의 크기에 차이가 줄어들어 IoU 값은 1에 가까워지는 것이다.
동일한 과정을 반복
모르는 수 5개가 적힌 공이 주머니 안에 있다고 하자. 그 공을 꺼내 책상 위에 순서대로 놓는다면 어떻게 할까?먼저 하나의 공을 책상 위에 놓고 다른 공 하나를 꺼내 차이를 알아본다. 작은 수가 적힌 공을 다른 주머니에 넣는다. 그렇게 네 번을 하면 가장 큰 수가 책상 위에 남는다. 다시 주머니에 넣은 네 개의 공을 가지고 위와 같은 과정을 세 번 반복하면 다음으로 큰 수를 놓게 된다. 그런 식으로 과정을 반복하면 5개의 공이 적힌 수 순서대로 책상 위에 배열되고 주머니에는 공이 줄어들다가 마침내는 남아 있지 않게 된다.
위 사례는 동일한 등가 비교 연산을 여러 차례 반복하다 연산을 끝내고 있음을 보여준다. 지문의 ‘대상별로 가장 높은 신뢰도 점수를 가진 경계 상자 하나씩만 남’기는 과정도 이와 비슷하다. ‘이러한 방법으로 … 가장 높은 신뢰도 점수를 가진 경계 상자를 기준으로 다른 경계 상자들을 하나씩 삭제해 나간다’는 것은 경계 상자를 비교하는 연산을 여러 차례 반복해 하나를 결정하는 방식이다. 이때 ‘지워지지 않고 남겨진 경계 상자 중에서 가장 높은 신뢰도 점수를 가진 경계 상자를 다음 기준으로 정하여 동일한 과정을 반복한다’고 했는데, 이는 위 사례의 ‘다시 주머니에 넣은 네 개의 공을 가지고 위와 같은 과정을 반복하’는 것과 같다.위 사례와 달리 지문에는 또 다른 동일한 과정의 반복이 있다. ‘이러한 과정을 다른 모든 대상에 표시된 경계 상자들에 대해서도 순차적으로 반복한다’는 것이 바로 그것이다. 앞의 동일한 과정 반복과 달리 경계 상자 중 ‘한 가지 종류의 객체를 기준으로 신뢰도 점수가 높은 경계 상자를 찾’는 과정이 추가되는 것이다.
포인트
1. '문제 발생의 원인-문제 상황-문제 해결 방법-문제 해결 결과' 등을 설명한 글이 많다.2. 알고리즘은 어떤 문제의 해결을 위해, 입력된 자료를 토대로 원하는 출력을 유도하는 규칙의 집합이다.3. 경우의 수를 고려해 문제 상황을 구체화하며 읽어야 할 내용이 있다.
4. 동일한 등가 비교 연산을 여러차례 반복하다 연산을 끝내는 과정을 이해하자.