본문 바로가기

분류 전체보기

(123)
3. 분포 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념, 피터 브루스, 앤드루 브루스 지음 아래 내용은 위의 책을 보고 제가 공부한 내용을 적은 것입니다. 혹시나 든 예시, 계산 등에 틀린 점이 있다면 꼭 알려주세요. 데이터 분포 탐색 데이터의 위치, 변이뿐 아니라 데이터가 어떻게 분포되어 있는지를 알아보는 것도 유용하다. 상자그림(boxplot): 데이터의 분포를 시각화하기 위한 간단한 방법으로 소개한 그림도수분포표(frequency table): 어떤 구간에 해당하는 수치 데이터 값들의 빈도를 나타내는 기록히스토그램(histogram): x축은 구간들을, y축은 빈도수를 나타내는 도수 테이블의 그림밀도 그림(density plot): 히스토그램을 부드러운 곡선으로 나타낸 그림, 커..
2. 추정 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념, 피터 브루스, 앤드루 브루스 지음아래 내용은 위의 책을 보고 제가 공부한 내용을 적은 것입니다. 혹시나 든 예시, 계산 등에 틀린 점이 있다면 꼭 알려주세요. 위치 추정 데이터를 살펴보는 가장 기초적인 단계는 각 피처의 대푯값을 구하는 것이다. 이는 곧 대부분의 값이 어디쯤에 위치하는지를 나타내는 추정값이다. 평균(mean): 모든 값의 총합을 개수로 나눈 값가중 평균(weighted mean): 가중치를 곱한 값의 총합을 가중치의 총합으로 나눈 값중간값(median): 데이터에서 가장 가운데 위치한 값가중 중간값(weighted median): 데이터를 정렬한 후, 각 가중치 값을 위에서부터 더할 때, 총합의 중간이 위치하는 ..
1. 데이터의 형태 정형 데이터 일상적으로 생성되는 수많은 실시간 데이터들은 대부분 정형화되지 않은 상태이다. 데이터 과학에서 가장 중요한 것 중 하나는 이런 정형화되지 않은 데이터(raw data)를 활용 가능한 형태의 정보로 변환하는 것이다. 일반적으로 아는 통계적인 개념들을 활용하기 위해서는, 정형화되지 않은 원시 데이터를 가공해 정형화된 형태로 변환하거나 처음부터 특정 목적으로 수집해야한다. - 정형 데이터의 종류연속형(continuous): 일정 범위 안에서 어떤 값이든 취할 수 있는 데이터 (구간형, 실수형, 수치형 데이터) - 풍속, 지속시간 등이산형(discrete): 횟수와 같은 정수 값만 취할 수 있다. (정수형, 횟수 데이터) - 사건의 발생 빈도 등범주형(categorical): 가능한 범주 안의 값만..
1. 딥러닝 환경설정하기 - 파이썬 3.6 64bit 설치 - 아나콘다 설치하기 (파이썬 3.6) 아나콘다 설치한 다음 필요한 라이브러리를 설치합니다. Anaconda Prompt를 켜서 conda create -n tutorial python=3.6 numpy scipy matplotlib spyder pandas seaborn scikit-learn h5py - 텐서플로 설치하기activate tutorialpip install tensorflowtensorflow 설치할 때 오류 발생하면 pip 버전을 업그레이드합니다.그것도 안되면 python 비트를 확인합니다. python 32비트라면 64비트로 업그레이드합니다.python 3.7.x 버전이라면 3.6.x, 3.5.x로 변경합니다. - 텐서플로 설치하고 나면 python..
정보처리기사 필기 합격 필기 붙은지 꽤 됐는데 이제야 후기 남깁니다. 한 달 가량 2018 시나공 정보처리기사 필기로 공부했어요. 시험 볼 때는 헷갈리긴 했지만 심하게 어렵다는 느낌은 없었고 오히려 너무 쉬워서 딱 퇴장할 수 있는 시간 되자마자 뛰쳐나왔습니다. 점수는 잘 나오진 않았어요. 딱 합격할 정도입니다. 쉽긴 했는데 심하게 헷갈렸나봐요. 열심히 안한거겠죠? 기간은 길었지만 매일 일정시간 꾸준히 보다가 3일 정도 빡세게 공부하니까 합격할 정도입니다. 4년제 컴퓨터공학과 대학생이라 익숙한 내용들이 많이 나오더라구요. 이제 실기 준비해야겠습니다. 약 한달 남았으니까 실기도 해보고 후기 남길게요. 혹시 시나공 정보처리기사 필기 책 필요하신 분 1, 2권이랑 얇은 모의고사 책 있는데 그냥 개념만 볼 수 있을 정도의 상태고 문제는..
2018. 4월 정보처리기사 도전기 안녕하세요. 저는 컴퓨터공학과 4학년에 재학중인 평범한 대학생입니다. 저희 학교 졸업요건 중에 하나인 정보처리기사는 컴퓨터에 관련된 자격증을 따려는 분들이 많이 도전하는 시험인데요, 막상 정말 이 자격증이 필요한 저는 아무런 동기부여를 얻지 못하고 2018년 4월 시험을 4월이 되어서야 준비하게 되었습니다. 정신차리고보니 23일 밖에 남지 않았네요... 꽤 오래전부터 2018 시나공 필기책을 가지고 있었는데 막상 구입했을 때나 지금이나 막막하긴 마찬가지입니다. 그래서 이렇게 블로그에 글을 남겨 기록한 뒤 맞추고 따라가보면서 공부해 볼 생각입니다. 정보처리기사 출제 기준에도 나와있듯이 5개 과목이 있는데요, 데이터베이스전자계산기 구조운영체제소프트웨어 공학데이터 통신 이렇게 다섯 과목입니다. 한 과목에 5일..
고도엔진 튜토리얼 #26 3D 메시 임포트하기 (Importing 3D meshes) 서론 고도는 씬 천제를 임포팅 가능한 강력하고 유연한 3D 씬 임포터를 지원합니다. 많은 아티스트와 개발자들에게 충분하고도 남은 것입니다. 하지만, 많은 사람이 이 워크플로우를 싫어하며 단일 3D 메시를 임포트해 씬 안의 3D 고도 에디터 안에서 빌드하는 것을 더욱 선호합니다. (스켈레톤 애니메이션과 같은 진화된 기능이 있으며 3D 씬 임포터에는 없는 기능들이라는 것을 참고하세요). 3D 메시 임포트 워크플로우는 간단하며 OBJ 파일 형식을 써서 작동합니다. 임포트된 메시들은 결과적으로 MeshInstance에 사용자가 입력할 수 있는 .msh 이진 파일로, 편집된 씬의 어딘가에 위치할 수 있습니다. 임포팅 3D 임포팅 메쉬 메뉴를 통한 임포팅은 다음과 같습니다 : 메시 임포트 창을 엽니다 : 이 대화상..
고도엔진 튜토리얼 #25 3D 성능과 제한(3D performance and limitations) 서론 고도는 균형잡힌 성능 철학을 따릅니다. 성능의 세계에서는 유용성과 유연성을 위한 거래 속도로 구성되는 trade-off입니다. 몇몇 실용적인 예가 있습니다 : 많은 양의 오브젝트를 효과적으로 렌더링하는 것은 쉽지만 큰 씬을 렌더링 하는 경우 비효율적일 수 있습니다. 이를 해결하기 위해, 렌더링에 시각적 계산을 추가해 렌더링 효율성이 낮아지지만 동시에 렌더링되는 개체가 줄어들어 전반적인 효율성이 향상됩니다.렌더러가 필요한 모든 오브젝트를 위한 모든 자료(material)의 속성을 구성하는 것도 느립니다. 이를 해결하기 위해, 오브젝트는 자료의 값이 적은 순으로 정렬되어 있지만 이 정렬을 하느데도 값이 듭니다.3D 물리학에도 비슷한 상황이 생깁니다. 큰 값의 물리 물체를 다루는 데의 최고의 알고리즘은 ..