Computer Science

    Data wrangling #2 - Data Scaling

    2022.06.06 - [Computer Science/DL || ML] - Data wrangling #1 - Data Cleaning Data wrangling #1 - Data Cleaning 좋은 데이터사이언티스트들은 상당한 시간을 data를 cleaning 하거나 formatting 하는데 쓴다고 할 정도로 Data wrangling은 중요하다. Data wrangling 이란? Data wrangling is the process of transforming and.. faceyourfear.tistory.com 저번 시간 Data cleaning에 이어 Data wrangling의 한 종류인 Data scaling에 대해 살펴보자. KNN 알고리즘 포스팅에서도 설명했듯이, Data scali..

    Data wrangling #1 - Data Cleaning

    좋은 데이터사이언티스트들은 상당한 시간을 data를 cleaning 하거나 formatting 하는데 쓴다고 할 정도로 Data wrangling은 중요하다. Data wrangling 이란? Data wrangling is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate for further analysis. 즉, 가공되지 않은 날 것의 data를 분석에 용이하게 가공하고 다듬는 작업을 뜻한다. Data wrangling 에는 여러 기법들이 있는데, 이번 포스트에서는 data cleaning 에 대해 알아보자...

    [운영체제] Thread(쓰레드)

    본 내용은 [Operating Systems : Three Easy Pieces] 및 부산대학교 안성용 교수님의 운영체제 수업을 참고하였습니다. Three Easy Pieces 중 첫번째 piece는 Virtualization 즉 가상화였다. 하나의 물리적 CPU를 다수의 가상 CPU로 확장해서 마치 여러 개의 프로세스가 동시에 실행되는 듯한 환상을 만들고, 또한 개별적인 process가 모두 독립적으로 많은 가상 메모리를 가지는 것처럼 느끼게 하는 address space라는 개념을 배웠다. 즉, CPU와 Memory의 virtualization에 대해서 다뤘다. 이제는 병행성 즉 Concurrency에 대해서 다루게 된다. Thread 소프트웨어가 진보하면서 하나의 프로그램에서 복잡한 동시 작업을 요..

    [JavaScript] alert, prompt, confirm

    이 글은 ko.javascript.io의 화살표함수 기본 편을 참고하였습니다. 웹을 위한 코딩을 할 때 사용되는 기능들이다. alert alert는 실행되면 '확인(OK)' 버튼과 메시지를 보여주는 창이 뜨게 된다. alert('Hi, there!'); prompt 브라우저에서 제공하는 prompt 함수는 두 개의 parameter를 받는다. 첫 번째 인수에는 창에 띄울 값(보통 사용자에게 물을 질문이 됨), 두 번째 인수는 기본 default로 설정할 값이다. 예를 들면 다음과 같다. let name = prompt('당신 이름이 뭐야?', '길동인데요'); 코드의 결과로 위처럼 '당신 이름이 뭐야?' 라는 문자열을 출력하고 사용자로부터 어떠한 값을 입력받는다. 그 default값으로 위의 '길동인데요..

    [운영체제] Swapping

    본 내용은 [Operating Systems : Three Easy Pieces] 및 부산대학교 안성용 교수님의 운영체제 수업을 참고하였습니다. 앞에서는 address space가 매우 작아서 모두 physical memory에 할당이 된다고 가정하였지만, 실제로는 address space의 크기도 크고 수많은 process가 실행되므로 physical memory 의 공간이 충분하지 않다. 따라서, 추가적인 레벨의 메모리 계층이 필요하다. (현대 운영체제는 hard disk가 그 역할을 하고 있음) 위의 그림은 memory hierarchy를 보여주고 있는데, 밑의 층이 위의 층의 "backing store" 역할을 한다. 즉, cache는 register의 backing store 역할을 하고 mai..

    [ML] KNN(k-Nearest Neighbor)

    KNN 에 대해 알아보기 전에, 먼저 Lazy learning과 Eager learning 에 대해서 알아보자. Lazy learning vs Eager learning - Lazy learning : 그냥 training data를 저장하기만 한다(최소한의 processing을 하기도 함). 그리고 test tuple 이 주어질 때까지 기다린다. ( 모델 미리 만들어두지 않음) - Eager learning : training set이 주어지면, new data(classify를 하려고 하는 data)가 들어오기 전에 미리 classification model을 만들어 둔다. 그렇다면, knn은 lazy learning 일까, eager learning 일까? knn은 전형적인 lazy learning..