Python 기반의 텍스트 데이터 분석 정규화

교육일정 | |
---|---|
교육시간 | 3일, 21시간 / 09:30~17:30 |
교육장소 | 한국생산성본부 2층 207호 |
고용보험 | 고용보험 비환급 ? |
교육비
|
정상가 750,000 원 KPC 유료법인회원 690,000 원 |
교육문의 | ICT교육센터 김지은 / 02-724-1218 / jekim@kpc.or.kr |
교육시간
09:30~17:30
교육목적/특징
■ 텍스트 데이터의 자연어 처리 및 사례분석 기초 과정으로, 실습 90%, 이론 10% 구성으로 진행된다.
■ 유의미한 단어 분석, 감성 분석 등 기초에서 고급 데이터 분석까지 누구나 쉽게 이해할 수 있다.
■ 데이터 분석 기초 능력에서
실제 업무 사례 기반의 분석까지 텍스트 분석의 기초 소양을 키울 수 있다.
■ 텍스트 데이터 분석 결과를
바탕으로 새로운 기획 방향을 예측하고 솔루션을 제시할 수 있다.
■ ChatGPT를 활용하여 생성 모델의 개념과 실무에 적용하는 방법을 학습한다.
교육대상
■ Python 데이터 분석 역량을 높이고자 하는 실무자
■ Python을 활용하여 텍스트 빅데이터
수집을 하고자 하는 실무자
■ Python을 활용한 텍스트 데이터
분석 기법을 익혀 새로운 기획에 활용하고자 하는 실무자
■ Python을 활용하여 텍스트 마케팅
선호도 반응을 분석하고자 하는 실무자
교육내용
일자 | 내용 |
---|---|
1일차 | [Phase 01] 텍스트 분석 실무 사례와 구조 패턴 - 텍스트 분석 실무 사례 탐색 - 텍스트 업무 분석 유형별 과정과 주요 특징 파악 - Python 자연어 처리 텍스트 분류 요약 구조 |
[Phase 02] 문자열을 다루는 기초 문법 - 문자열의 길이, 단어 수 측정 - 문자열 표현과 반복 실행 기법 - 실습 : 문자열을 내장 함수로 목록화 | |
[Phase 03] Python 피처 기본 추출 - 텍스트 데이터 정제 및 토큰화 - TF-IDF 표현과 특수한 피처 추출 - 실습 : TF-IDF 가중치를 적용하는 방법 | |
2일차 | [Phase 04] 웹 텍스트 데이터 수집 - 웹 페이지 스크래핑 데이터 수집 - 정규 표현식을 사용하여 데이터 추출 및 분석 - 실습 : API로 분석 데이터 추출 |
[Phase 05] 텍스트 데이터 타이틀 분류 - 텍스트 분류를 위한 기본 설정 - 데이터의 문자 전처리 및 벡터화 - 실습 : 연합 뉴스 타이틀 주제 분류 | |
[Phase 06] 텍스트 수준 벡터 표현과 시각화 - 문자 수준과 위치 기반 인코딩 - 문자, 단어 임베딩 - Word2Vec - 실습 : 국민청원 데이터 시각화 분류 | |
3일차 | [Phase 07] 감성분석과 토픽 모델링 분류 - 탐색적 데이터 분석과 문서 군집화 - 감성 토픽 벡터를 사용한 문서 시각화 - 실습 : 잠재 할당으로 감성 토픽 분류하기 |
[Phase 08] 이벤트 텍스트 분석과 예측 - 추출적, 추상적 텍스트 요약 - 단어 빈도 수를 이용한 텍스트 요약 - 실습 : 인프런 이벤트 댓글 분석 | |
[Phase 09] ChatGPT를 활용한 문장 생성 자동화 - 생성 모델의 개념 - 생성 모델의 파라미터 크기와 종류 - 실습 : 한국어 생성 서비스 : 뤼튼 |
※ 본 교육과정은 모집인원 미달시 폐강이 될 수 있음을 안내해 드립니다.
수강후기
연관 자격
자격증명 | 자격증관련링크 |
---|