본문 바로가기

분류 전체보기58

[생명과학을 위한 딥러닝] 3장. DeepChem을 이용한 머신러닝 (1) 본격적인 내용에 들어가기 전에, 이 코드 하나를 실행시키기 위해 겪은 우여곡절을 정리하려한다. 잘 안 쓰이는 머신러닝 라이브러리인 DeepChem이다보니 환경 셋업만 몇 시간 걸렸는지 모르겠다. 나 같은 사람이 다시 나타나지 않도록… DeepChem 설치하기 https://deepchem.io/ DeepChem Get Started. Select your preferences, then run the DeepChem install command. Conda is our recommended package manager Version stable nightly Package Manager conda pip docker GPU Enabled deepchem.io 공식 홈페이지에 친절하게 설치하는 방법을 알려.. 2022. 10. 15.
[SW 코딩 훈련] 핵심 HTML/CSS 기초 01. 웹사이트 만들기 프로그래밍이란? 컴퓨터와 소통하는 방법을 의미 컴퓨터에게 전달하는 정보를 어떻게 보여주고 제어할지 결정 가능 웹 개발을 하기 위한 언어로 브라우저와 소통 웹을 구성하는 요소 HTML : 웹페이저의 정보 또는 설계도 CSS : 웹페이지의 디자인 또는 스타일링(SS를 Style Sheet라고 한다) JavaScript : 웹페이지의 기능과 효과 어떤 건물을 지을 때 건물 설계도를 HTML라 할 수 있고, 인테리어 디자인은 CSS, JavaScript는 엘레베이터의 기능과 효과 등으로 비유할 수 있다. 웹사이트를 만드는 건 건물을 짓는 과정과 비슷하다고 할 수 있다. 출력하고자 하는 문구 태그 : 열린 태그 와, 닫힌 태그 로 이루어져 있다. 열린 태그는 시작 머리에, 닫힌 태그는 코드 입력이 끝난 후에 사용.. 2022. 10. 11.
[AI 데이터 분석] 산업 데이터를 활용한 인공지능 프로젝트 04. 금융 거래 고객 신용 위험도 예측 보호되어 있는 글 입니다. 2022. 10. 11.
[AI 데이터 분석] 산업 데이터를 활용한 인공지능 프로젝트 03. 반도체 공정 데이터를 활용한 공정 이상 예측 보호되어 있는 글 입니다. 2022. 10. 10.
[AI 데이터 분석] 산업 데이터를 활용한 인공지능 프로젝트 02. 교통 표지판 이미지 분류 보호되어 있는 글 입니다. 2022. 10. 10.
[AI 데이터 분석] 산업 데이터를 활용한 인공지능 프로젝트 01. 의류 판매 상품 리뷰 분석을 통한 상품 추천 여부 예측 보호되어 있는 글 입니다. 2022. 10. 10.
[AI 데이터 분석] 딥러닝 시작하기 03. 다양한 신경망 (2) 자연어 처리 과정 자연어 전 처리(Preprocessing) 단여 표현(Word Embedding) 모델 적용하기 (Modeling) 원 상태 그대로의 자연어는 전 처리 과정이 필요하다. 대표적 전 처리 과정은 다음과 같다. 오류 교정(Noise canceling) 잘못된 문장을 표준화에 맞게끔 변경하는 일이다. 자연어 문장의 스펠링 체크 및 띄어쓰기 오류 교정 과정이다. 기본적인 오류 교정은 거쳐야 깔끔해지고 성능도 좋아진다. 토큰화(Tokenizing) 문장을 나누는데 그 나눠진 단위를 토큰(Token)이라 한다. 토큰은 어절, 단어 등으로 목적에 따라 사용자가 다르게 정의한다. 문장 데이터를 딥러닝으로 입력해줘야 하는데 이미지 데이터에서도 이미지 그 자체를 입력으로 사용할 수 없었다. 하물며 문장을.. 2022. 10. 9.
[AI 데이터 분석] 딥러닝 시작하기 03. 다양한 신경망 (1) 기존의 데이터는 정형화된 DataFrame 형태로 입력을 해왔는데, 이미지 데이터는 그렇지 않다. 컴퓨터에게 이미지는 각 픽셀 값을 가진 숫자 배열로 인식된다. 이미지를 픽셀이란 작은 정사각형 단위로 나눠서 각 색깔에 맞게 값이 지정되는 것이다. 이미지 전 처리 모두 같은 크기를 갖는 이미지로 통일한다. 1) 가로 세로 픽셀 사이즈를 표현하는 해상도 통일을 먼저 진행한 후, 2) 색을 표현하는 방식을 통일한다(RGB, HSV, Gray-scale, Binary, ...) MNIST 데이터는 이미지 데이터이지만 가로 길이와 세로 길이만 존재하는 2차원 데이터이다. CNN 모델은 채널(RGB 혹은 흑백)까지 고려한 3차원 데이터를 입력으로 받기에 채널 차원을 추가해 데이터의 모양(Shape)을 바꿔준다. 합.. 2022. 10. 8.