바로가기

모두를 위한 열린 강좌 KOCW

주메뉴

강의사진
  • 주제분류
    공학 >컴퓨터ㆍ통신 >컴퓨터공학
  • 등록일자
    2015.09.21
  • 조회수
    2,626
  •  
분산파일 시스템(DFS: distributed file systems)과 MapReduce, 우수한 MapReduce의 알고리즘과 일반적인 알고리즘과의 차이점에 대해 소개할 것입니다. 나머지 과정은 커다란 데이터에서 모델과 정보를 추출하는 알고리즘에 대한 내용을 다룰 것입니다. 웹 페이지에서 구글의 PageRank 알고리즘 모델의 중요성과 다양한 목적을 위한 확장에 대해 배울 것입니다. 지역민감해싱(locality-sensitive hashing), 너무 커서 하나하나 비교하는 것이 불가능한 아이템의 항목들 중에 비슷한 아이템을 찾아주는, 약간은 마술과도 같은, 내용을 다룰 것입니다. 데이터가 대용량의 형태와 희소 행렬로 저장되어 있을 때, 축소차원은 데이터를 모형화하는 데 좋은 방법이지만, 일반적인 접근으로는 측정이 잘 되지 않습니다. 효율적인 접근이 무엇일까에 대해 이야기해 볼 것입니다. 계획표에 나와 있는 것처럼, 다른 형태의 대규모 알고리즘도 알아볼 것입니다.

차시별 강의

PDF VIDEO SWF AUDIO DOC AX
1. 비디오 week 1 맵리듀스 링크 분석 - 페이지링크 URL
2. 비디오 week 2 지역민감해싱 – 기초와 적용
거리측정
최근접이웃
빈발항목집합
URL
3. 비디오 week 3 데이터 스트림 마이닝
큰 그래프의 분석
URL
4. 비디오 week 4 추천시스템
차원축소
URL
5. 비디오 week 5 군집화
컴퓨테이셔널 광고
URL
6. 비디오 week 6 서포트-벡터 머신
의사결정 나무
맵리듀스 알고리즘
URL
7. 비디오 week 7 링크 분석 – 특정 주제 페이지링크, 링크스팸
민간해싱분석
URL

연관 자료

loading..

사용자 의견

강의 평가를 위해서는 로그인 해주세요. 로그인팝업