AI / DL/생명과학을 위한 딥러닝4 [생명과학을 위한 딥러닝] 4장. 분자 수준 데이터 다루기 분자 수준의 데이터에 머신러닝을 사용하는 것은 재료화학과 화학 분야에서 특히 유용하다. 노동 집약적인 실험의 양을 줄이고 머신러닝을 통해 새로운 분자 구조를 예측할 수 있기 때문이다. 다시 말해 무작위로 실험하는 대신 머신러닝 모델로부터 제안된 분자를 사용해 실험함으로써 성공 가능성을 높일 수 있다. 분자 수준 데이터에 머신러닝을 적용하기 위해 먼저 분자 구조 데이터를 벡터로 변환하는 분자 피처화(molecular featurization)가 필요하다. 분자는 복잡한 구조를 갖기 때문에 이를 표현하기 위해 다양한 기술이 개발됐다. 분자 피처화가 끝나면 머신러닝을 진행한다. 분자 데이터 피처화 SMILES 문자열과 RDKit SMILES(Simplified Molecular-Input Line-Entry .. 2022. 10. 18. [생명과학을 위한 딥러닝] 3장. DeepChem을 이용한 머신러닝 (2) MNIST 데이터셋으로 필기 인식 모델 만들기 이번 프로젝트도 오류가 많아서, 설명하면서 정정하려고 한다. 앞에서는 DeepChem에 사전 정의된 모델인 dc.models.MultitaskClassifier를 사용해 머신러닝을 했다. 그러나 사전 정의된 모델보다 사용자가 직접 모델을 정의하는 일이 더 많다. 직접 합성곱 신경망 모델을 만들어 MNIST 필기 인식 데이터셋에 적용시키는 방법을 배운다. MNIST 필기 인식 데이터셋은 필기된 숫자를 올바르게 분류하는 머신러닝에 많이 사용된다. 전체적인 구조는 이미지의 일부 피처를 식별하기 위한 두 개의 합성곱 레이어로 시작해서 두 개의 완전 연결 레이어(full connection layer)를 통해 이미지에 적힌 숫자를 예측한다. 시작하기에 앞서 터미널에 .. 2022. 10. 17. [생명과학을 위한 딥러닝] 3장. DeepChem을 이용한 머신러닝 (1) 본격적인 내용에 들어가기 전에, 이 코드 하나를 실행시키기 위해 겪은 우여곡절을 정리하려한다. 잘 안 쓰이는 머신러닝 라이브러리인 DeepChem이다보니 환경 셋업만 몇 시간 걸렸는지 모르겠다. 나 같은 사람이 다시 나타나지 않도록… DeepChem 설치하기 https://deepchem.io/ DeepChem Get Started. Select your preferences, then run the DeepChem install command. Conda is our recommended package manager Version stable nightly Package Manager conda pip docker GPU Enabled deepchem.io 공식 홈페이지에 친절하게 설치하는 방법을 알려.. 2022. 10. 15. [생명과학을 위한 딥러닝] 2장. 딥러닝 소개 머신러닝으로 문제를 해결할 때는 수식으로 표현하는 것이 가장 중요하다. $y = f(x)$ 위의 수식에서 $x$와 $y$는 수학적 표현인 벡터(vector)를 의미한다. 함수 $f(x)$는 입력 벡터를 받아 출력 벡터를 만든다. 아래의 목록은 다양한 문제를 어떻게 수학적 함수로 표현할 수 있는지 보여주는 예시이다. 사진의 모든 픽셀 정보가 벡터 $x$에 들어있고 함수 $f(x)$는 고양이 사진인 경우 1을 출력하고, 그렇지 않으면 0을 출력한다. → 이진 분류? 위의 예시와 동일하지만 함수 $f(x)$의 출력값이 숫자로 구성된 벡터다. 예를 들어 벡터의 첫 번째 요소는 이미지에 고양이가 포함돼 있는지를, 두 번째 요소는 개가 포함돼 있는지를, 세 번째 요소는 비행기가 포함돼 있는지를 나타낸다. $x$는 .. 2022. 10. 3. 이전 1 다음