2016년 6월 18일 토요일

실수를 덮기 위해 거짓말을?

안녕하세요. 이원준입니다.

6평 국어영역 문제 유출로 덮인 뉴스가 하나 있습니다.
바로 19번 출제오류가 없다고 교평이 발표를 했는데 그 내용이 황당한 거짓말이란 점이죠.
요즘 실수를 인정하면 젠틀맨, 실수를 인정하지 않으면 '개저씨'(개+아저씨)라던데
교평이 학생들 앞에서 개저씨 같은 모습을 보여서 실망이 큽니다.

요즘 저는 깨어 있는 시간 내내 강의 시간을 제외하면 모의고사를 출제하고 있습니다.
그래서 굳이 제가 반론하지 않더라도 '제세현이 없으랴'라고 생각하면서
누군가가 반론할 것이라 생각했고 생각대로 '포만한'에 이미 훌륭한 반론이 올라왔습니다.

http://cafe.naver.com/pnmath/866729

그러나 요즘 오르비를 보니 6평 유출 사건으로 인해서 19번 출제오류는 잊혀진 것 같더군요. 한번 정리하고 가야 할 것 같아서 이 글을 씁니다.

우선 교육과정평가원에서 발표한 이의제기에 대한 답변서는 다음과 같습니다.

"19번

이 문항은 지문에서 설명한 내용을 바탕으로 <보기>의 상황에 대해 가장 적절하게 이해한 것
이 무엇인지 묻고 있습니다.
이의 신청의 주된 내용은 정답지 도 적절하지 않다는 것입니다.
그러나 정답지 의 진술은 적절한 이해에 해당합니다. 지문에서는 가중합을 구하는 원리를 각각의 입력 단자에 할당된 가중치를 입력값에 곱한 값들을 모두 합하여”(둘째 단락)라고 규정하였습니다. 또한 지문에서는 가중치 갱신의 원리를 어떤 학습 데이터가 주어지면 (중략) 정답에 해당하는 값에서 출력값을 뺀 값 즉 오차 값을 구한다. 이 오차 값의 일부가 (중략) 출력 신호를 만드는 데 관여한 모든 가중치들에 더해지는 방식으로”(다섯째 단락)라고 규정하였습니다. 지문에서 설명한 이 두 가지 원리를 종합하면 가중치 Wb도 일정한 오차 값이 더해져 늘어나는바, 정답지 은 적절한 이해입니다.
이의 신청에서는 입력값이 0일 경우에는 그에 해당하는 가중치가 출력에 관여하지 않는다고 주장하고 있으나, 지문에서 규정한 출력값 계산 방법은 가중치와 입력값의 곱의 합임계치를 비교하는 방식이므로 모든 가중치는 항상 출력값 계산에 관여하고 있습니다.
또한 이의 신청에서는 지문에 제시되지 않은 정보를 임의로 인용하여 가중치 갱신 양을 판단하고 있는데, 이러한 판단도 오차 값에 입력값을 곱하지 않고 오차 값의 일부만 가중치 갱신에 이용하는 것으로 설명하는 지문의 진술에 비추어볼 때 합당하지 않습니다. 이의 신청자가 인용한 학습 방법은 델타 규칙(Delta Rule)으로서 가중치 갱신 양을 학습률×오차값×입력값으로 정의하고 있습니다. 델타 규칙은 인공 신경망이 개발되던 초기에 단층 퍼셉트론에서 가중치 갱신을 위해 사용되던 방법입니다. 초기에는 수학적 증명 없이 사용되었으나, 인공지능 분야 권위자인 민스키(Minsky)에 의해 델타 규칙으로는 해결할 수 없는 문제가 존재한다는 것이 증명되었습니다.
또한 델타 규칙을 사용하기 위해서는 오차 값이 출력값과 정답 간의 차이의 제곱으로 정의되어야 하며, 활성 함수는 미분 가능한 연속 함수로 정의되어야 한다는 것이 전제 조건입니다. 하지만 지문에서는 오차 값을 출력값과 정답값 간의 차이의 제곱이 아니라 정답에 해당하는 값에서 출력값을 뺀 값으로 정의하고 있고 활성 함수는 미분 가능한 연속 함수가 아니라 임계치에 의해 01로 구분되는, 미분 불가능한 함수로 정의하고 있습니다. 이처럼 이의 신청자가 인용한 학습 방법은 퍼셉트론의 여러 학습 방법 중 하나이기는 하나, 지문에서는 이와 다른 학습 방법을 설명하고 있으므로 이의 신청에서 인용한 가중치 갱신 방법을 그대로 적용할 수 없습니다.
이 문항에 대한 이의 신청은 국어 시험의 성격과 목적에 맞춰 작성된 독서 지문의 성격과 내용을 이해하지 못한 채, 지문 밖의 지식을 단편적으로 이해하여 제기한 것입니다. 수능 국어 시험 중 독서 영역은 지문을 이해하고 문제를 해결하는 능력을 측정하기 위한 영역이므로 지문 밖의 지식을 임의로 끌어들여 독서 영역 문항을 해결하려는 방식은 적절하지 않습니다.
따라서 이 문항의 정답에는 이상이 없습니다."



이 답변서를 자문을 구했던 서울대 인공지능 전공 교수님께 보여드렸더니 퍼셉트론에 대해서 모르지는 않지만 알고 있다고 보기도 어려운 사람이 쓴 글이라고 하시더군요.
이 글은 교육과정평가원의 흑역사로 기록될 글입니다.

저 답변서에서 가장 문제가 되는 부분은 빨간 색으로 표시된 부분입니다.
" 델타 규칙을 사용하기 위해서는 오차 값이 출력값과 정답 간의 차이의 제곱으로 정의되어야 하며, 활성 함수는 미분 가능한 연속 함수로 정의되어야 한다는 것이 전제 조건입니다."

이는 델타 규칙에 대해서 정확하게 알지 못하고 쓴 글입니다.

델타 규칙을 사용하기 위해서 활성 함수는 반드시 '미분 가능한 연속 함수'여야 하는 것은 아닙니다. '활성함수'에는 세 가지 종류가 있습니다.


6평 19번 지문은 위 그림에서 (a) 계단함수(step function)을 사용하는 퍼셉트론을 묘사하고 있습니다. 델타 규칙을 이용한 퍼셉트론 학습에서 가장 기본적인 함수입니다.





영문 위키피디아에서도 델타 규칙에 대해서 다음과 같이 설명하고 있습니다.
출처: https://en.wikipedia.org/wiki/Delta_rule


델타 규칙이 퍼셉트론에 사용될 때에는 직접적 적용이 불가능하기 때문에 계단 함수(step function)을 쓴다고 되어 있습니다.

우리말로 된 위키백과에도 다음과 같이 '선형 활성함수'를 갖는다고 설명하고 있습니다.



그리고 델타 규칙에서 오차값은 (목표값-출력값)이지 제곱이 아닙니다.
위 공식에 (t-y) 항에 제곱이 없잖아요?

퍼셉트론 델타규칙 예제에 대해서 궁금하신 분들은 아래 유튜브 영상을 보셔도 좋습니다.
저 영상이 시키는 대로 19번 문제 [B] 데이터를 넣어서 만들어 봤습니다.
Wb가 0.5 그대로라서 증가하지 않는다는 것을 확인할 수 있습니다.



결론은, 교육과정평가원에서 전문용어로 잔뜩 멋을 부린 저 문서가 황당한 변명이라는 것입니다.
앞으로도 계속 저 문서가 남아 있을 텐데 많이 부끄러워하길 바랍니다.

그리고 앞으로 교육과정평가원에서 6평, 9평, 수능의 해설을 제공했으면 좋겠습니다.
'풀이의 획일화'를 막기 위해서 해설을 제공하지 않는다는 말이 무슨 소린지 모르겠습니다.
원칙에 따라 풀어서 풀이가 획일화된다면 결코 나쁜 일이 아닙니다.
교육과정평가원에서 주관한 MEET 언어추론 회의록을 보면 솔직하게 나와 있습니다.
"논란을 막기 위해" 해설을 공개하지 않는다고요.
LEET 언어이해는 출제기관에서 해설을 공개하고 있지만 부작용이 없으며 출제 과정을 검증할 수 있다는 좋은 장점이 있습니다.
그러면 교평도 개저씨에서 벗어날 수 있지 않을까요?





댓글 2개: