기계학습8 기계학습 포텐셜에 사용하는 데이터를 준비하는 방법 기계학습 알고리즘을 사용할 때, 기계학습 알고리즘의 성능을 높이기 위해서는 문제에 맞는 모델을 사용하는 것도 중요하지만 적절한 데이터를 준비하는 것 역시 매우 중요하다. 일반적으로 기계학습 알고리즘이 적용되는 분야인 컴퓨터를 이용한 이미지 처리, 자연어 처리, 음성 처리 같은 경우 각 데이터 간의 연관성(Correlation)이 적고, 데이터를 준비하는 데 걸리는 시간이 상대적으로 짧기 때문에 많은 데이터를 준비하기 용이하고 데이터의 분포 역시 비교적 평탄하게 만들 수 있다. 또한 데이터의 일부를 치환하는 등의 Data Augmentation 역시 그리 어렵지 않기 때문에 특정 목적에 맞게 데이터를 늘리는 것 역시 아주 어렵지 않다. 따라서, 필자가 아는 범위 내에서는 이러한 분야의 경우 기계학습 모델에.. 2022. 6. 27. Graph Model을 활용한 재료의 3차원 구조 묘사 재료를 구성하고 있는 원자의 3차원 좌표를 기계학습의 입력값으로 사용할 수 있는 형태의 벡터로 바꾸어 주는 변환 함수는 기계학습 포텐셜에 있어 필수적이라고 할 수 있다. 하지만, 고정된 형태의 함수를 사용하는 변환 함수의 경우 그 성능에 한계가 있을 수 있기 때문에 기계학습을 사용하여 변환 함수의 성능을 개선하려는 연구들이 많이 발표되었다. 이러한 방법 중 한 가지 방법은 재료의 3차원 좌표를 이용하여 3차원 이미지를 만든 뒤, 이를 Convolutional Neural Network를 사용하여 벡터로 바꾸는 형태이다. 하지만 이 방법의 경우 데이터의 양이 커 비효율적이라는 단점이 있다. 반면, 오늘 살펴볼 그래프(Graph)를 이용한 방법의 경우 그 형태가 원자와 원자 간 결합으로 이루어진 재료의 구조.. 2022. 6. 24. Convolutional Neural Network를 활용한 재료의 3차원 구조 묘사 기계학습 포텐셜을 구성하는 두 가지 요소, 변환 함수 및 기계학습 알고리즘 중 개선의 여지가 있는 부분은 기존에는 고정된 함수의 형태로 사용했던 변환 함수 부분이다. 변환 함수는 재료 내의 원자 하나와 그 원자 주변에 위치한 원자들의 3차원 좌표에 대한 정보를 추출하여 벡터로 만드는데, 이 과정에서 비슷한 구조는 가깝게, 서로 많이 다른 구조는 멀게 위치하도록 벡터를 구성해야 그 이후 기계학습 알고리즘에서 적절한 근사 함수를 찾기 용이해진다. 따라서, 이 과정 역시 기계학습을 이용하여 개선하려는 연구가 많이 출판되었는데, 이번 포스팅부터는 그중에서 몇 가지를 뽑아 살펴보도록 하겠다. 그 중 첫 번째로, 이번 포스팅에서는 재료의 3차원 구조를 일종의 3차원 그림처럼 인식하고, 이를 처리하기 용이한 기계학습.. 2022. 6. 23. 기계학습 포텐셜에서 변환 함수의 역할 및 그 개선안 소개 기계학습 포텐셜은 재료 내 원자들의 3차원 좌표를 벡터 형태로 변환해 주는 변환 함수와 이를 통해 나온 벡터를 우리가 원하는 원자 당 에너지값으로 바꿔 주는 기계학습 알고리즘 두 부분으로 이루어져 있다. 우리가 지금까지 살펴본 두 가지 기계학습 포텐셜, GAP 및 NNP는 모두 이러한 형태를 따르고 있다. GAP의 경우 변환 함수로는 SOAP(본 블로그에서는 다루지 않았다!)을, 기계학습 알고리즘으로는 Gaussian Process를 사용하며, NNP의 경우 변환 함수로는 Atom Centered Symmetry Function을, 기계학습 알고리즘으로는 인공신경망을 사용한다. 자, 그럼 이제 기계학습 포텐셜을 연구하는 연구자의 입장이 되어 보자. 만약 우리가 이 방법론들을 개선해야 한다면 어느 부분을 .. 2022. 6. 23. 이전 1 2 다음