과학28 기계학습 포텐셜에 사용하는 데이터를 준비하는 방법 기계학습 알고리즘을 사용할 때, 기계학습 알고리즘의 성능을 높이기 위해서는 문제에 맞는 모델을 사용하는 것도 중요하지만 적절한 데이터를 준비하는 것 역시 매우 중요하다. 일반적으로 기계학습 알고리즘이 적용되는 분야인 컴퓨터를 이용한 이미지 처리, 자연어 처리, 음성 처리 같은 경우 각 데이터 간의 연관성(Correlation)이 적고, 데이터를 준비하는 데 걸리는 시간이 상대적으로 짧기 때문에 많은 데이터를 준비하기 용이하고 데이터의 분포 역시 비교적 평탄하게 만들 수 있다. 또한 데이터의 일부를 치환하는 등의 Data Augmentation 역시 그리 어렵지 않기 때문에 특정 목적에 맞게 데이터를 늘리는 것 역시 아주 어렵지 않다. 따라서, 필자가 아는 범위 내에서는 이러한 분야의 경우 기계학습 모델에.. 2022. 6. 27. 분자동역학에서 사용하는 Monte Carlo 방법론에 대하여 지금까지 기계학습 포텐셜에 대한 전반적인 내용들을 살펴보았다. 기계학습 포텐셜은 기계학습 알고리즘을 사용하여 기존 Classical Force Field를 개선하는 방법으로, 제일원리 계산을 통해 데이터를 구성하여 포텐셜의 정확도를 높이는 방법으로 Classical Force Field의 단점을 보완하였다. 하지만, 정확도가 늘어나는 만큼 어쩔 수 없이 계산 속도는 떨어지게 된다. 따라서, 기존 Classical Force Field로는 계산할 수 있는 스케일의 시뮬레이션도 기계학습 포텐셜을 사용하는 경우 계산 불가능해지는 경우가 있다. 이러한 상황에서 계산 속도를 더욱 끌어 올리기 위해 사용하는 방법들이 있는데, 그중 하나가 Monte Carlo 방법이다. 이 방법은 기계학습 포텐셜에서만 사용하는 것은.. 2022. 6. 26. Graph Model을 활용한 재료의 3차원 구조 묘사 재료를 구성하고 있는 원자의 3차원 좌표를 기계학습의 입력값으로 사용할 수 있는 형태의 벡터로 바꾸어 주는 변환 함수는 기계학습 포텐셜에 있어 필수적이라고 할 수 있다. 하지만, 고정된 형태의 함수를 사용하는 변환 함수의 경우 그 성능에 한계가 있을 수 있기 때문에 기계학습을 사용하여 변환 함수의 성능을 개선하려는 연구들이 많이 발표되었다. 이러한 방법 중 한 가지 방법은 재료의 3차원 좌표를 이용하여 3차원 이미지를 만든 뒤, 이를 Convolutional Neural Network를 사용하여 벡터로 바꾸는 형태이다. 하지만 이 방법의 경우 데이터의 양이 커 비효율적이라는 단점이 있다. 반면, 오늘 살펴볼 그래프(Graph)를 이용한 방법의 경우 그 형태가 원자와 원자 간 결합으로 이루어진 재료의 구조.. 2022. 6. 24. Convolutional Neural Network를 활용한 재료의 3차원 구조 묘사 기계학습 포텐셜을 구성하는 두 가지 요소, 변환 함수 및 기계학습 알고리즘 중 개선의 여지가 있는 부분은 기존에는 고정된 함수의 형태로 사용했던 변환 함수 부분이다. 변환 함수는 재료 내의 원자 하나와 그 원자 주변에 위치한 원자들의 3차원 좌표에 대한 정보를 추출하여 벡터로 만드는데, 이 과정에서 비슷한 구조는 가깝게, 서로 많이 다른 구조는 멀게 위치하도록 벡터를 구성해야 그 이후 기계학습 알고리즘에서 적절한 근사 함수를 찾기 용이해진다. 따라서, 이 과정 역시 기계학습을 이용하여 개선하려는 연구가 많이 출판되었는데, 이번 포스팅부터는 그중에서 몇 가지를 뽑아 살펴보도록 하겠다. 그 중 첫 번째로, 이번 포스팅에서는 재료의 3차원 구조를 일종의 3차원 그림처럼 인식하고, 이를 처리하기 용이한 기계학습.. 2022. 6. 23. 이전 1 2 3 4 5 6 7 다음