분류 전체보기 (29) 썸네일형 리스트형 [Python] 판다스(Pandas) **기록용입니다. Pandas 란? 1. 테이블 형태의 데이터를 분석 하기에 최적의 라이브러리이다. 2. numpy처럼 정형화된 데이터 연산에 최적화 되어 있다. 3. 성능이 매우 뛰어남 4. 다양한 정형 데이터를 통합 관리할 수 있다. - json, html, csv, xlsx, hdf5, sql, ... 모두 DataFrame으로 통일해서 표현 5. 엑셀에서 제공하는 연산 기능을 거의 다 제공 6. 편의성이 좋다. ** 사용하는 데이터 타입이 series, dataframe 2개밖에 없다. 정형데이터 타입 1. JSON(제이슨, JavaScript Object Notation) - 속성-값 쌍(attribute–value pairs), 배열 자료형(array data types) 또는 기타 모든 시리.. [Python] 웹 환경의 이해 **기록용입니다. [웹구조의 이해] 요청 naver.com >> 네이버에서 index.html 제공 >> 크롬에서 렌더링 >> 홈페이지 확인 [웹크롤링] 1. naver에 공식적인 request (API받기) 2. naver 기본화면 html -> (우클릭) 페이지 소스 보기 - 데이터를 가져올땐 정리가 된 데이터 (ex. 장 종료 후의 네이버 금융 사이트 등) 를 가져오는 것이 좋다. - real time data는 변동이 있으므로 이 점을 고려할 것. - 전제페이지가 있는데(url똑같음) 별도 페이지로 프레임소스보기가 가능하다면 그 프레임소스만 따로 봐야함(예전 구성) - 웹크롤링시 요청은 url로 하기 때문에 view-source: 이후 "주소"를 적어주면 된다. [동적페이지] - 자동으로 엑셀파일.. [Python] 6. 종류를 나타내는 집합 집합 - 집합의 연산자인 교집합, 합집합, 차집합을 모두 지원 - {1, 2, 3} : 집합 / {'a':1, 'b':2} : 사전 - 집합은 원소의 중복이 없다. 따라서 원소의 종류를 나타내기 좋다. - 집합은 원소의 순서도 존재하지 않아 indexing이 불가능하다. - 안에 원소가 있느냐 없느냐만 알 수 있다. 1) 교집합 & 를 사용 ex. s1 + s2 2) 합집합 +가 아닌 | 를 사용한다. 3) 차집합 ex. s1-s2 4) 집합 원소의 중복이 사라지는 경우 - 리스트의 경우 각 리스트를 집합으로 변경해준다 set() 함수 사용 5) 집합 관련 함수 - 원소추가하기 .add() - 공집합은 set() ** 순서 상관없이 결과는 정렬되서 나온다. - 집합에 여러원소 추가하기 .update( {.. [Python] 5. 데이터 다루기 - List, Tuple ** 기록용 입니다. 1. 리스트 - 가장 많이 사용되는 연속형 데이터 타입 - 다양한 타입의 원소를 다 포함함 1) 리스트 만들기 - [ ] 로 표현, 리스트 안에 리스트도 넣을 수 있다. 2) 인덱싱(Indexing) - 특정한 문자를 제공하기 위해서 어디에 어떤 데이터가 있는지 확인해야 한다. - 리스트의 인덱스는 맨 앞부터 0으로 시작해서 1씩 증가하는 정수 인덱스를 사용한다. (n-1번째 위치) - 맨 뒤부터 세는 방법은 -1, -2를 사용 - 인덱싱을 통한 연산 : 여러개의 리스트 안에 있는 요소들을 찾을 때에는 순차적으로 위치를 지정해주면 된다. 3) 슬라이싱(Slicing) - 리스트의 일부를 자른다. 특정 index만 가져온다 = 필터링 - pandas series, dataframe에서.. [Python] 4. 데이터 다루기 - 텍스트 **기록용 입니다. 2. 문자열 - 문자열데이터 : 문자의 나열 - 파이썬에서 다루는 문자열의 크기도 제한이 없음 - 전세계적으로 웹에서 사용되는 국제 표준은 UTF-8(Universal code character set Transformation Format - 8-bit) 1) 문자열 만들기 - ' 와 '' 두가지의 기호를 통해 나타낸다. - 특성을 알고 싶으면 type(문자)를 입력 -> str은 string - \n는 특수문자(escape code)라고 불리우는 새로운 규칙 - 줄 바꿈(enter)을 보기위해서는 print()함수를 사용 - \t는 4칸 띄어쓰기 2) 문자열의 연산 - 가운데 빈칸을 넣고 싶을때는 '빈칸' 을 덧셈에 넣는다. - 같은 문자열을 길게 반복하고 싶을때는 문자열*n 연산.. [Python] Anaconda3, Jupyter Notebook 실행하기 ** 기록용입니다. 1. Anaconda.Navigator을 실행 - 여러가지 실행파일이 뜨는데 그 중 Jupyter Notebook Launch를 클릭하면 됨 2. 바로켜는 방법 Anaconda Prompt 실행 - conda create -n test (원하는이름) python=3.11(version, 안쓰면 현재 설치한 파이썬 버전) anaconda(아나콘다에서 필요한 모든 library설치됨) - 설치가 이루어지면 conda activate test 입력 - (base)와 (test)가 생기면 test라인에 jupyter notebook 입력 후 실행 궤양성대장염(Ulcerative Colitis) 정의 궤양성 대장염은 소화관 중 대장에 국한되어 장 벽에 염증 또는 궤양이 발생하는 질환으로 아직 정확한 원인이 밝혀지지 않은 만성 재발성 질환입니다. 흔한 증상은 만성적으로 지속되는 혈변, 설사와 대변 절박증, 뒤무직 및 복통입니다. 궤양성 대장염에서 병적인 변화는 항문에 인접한 직장에서 시작되어 점차 안쪽으로 진행되는데, 병적인 변화가 여기저기 흩어져 있지 않고 모두 연결되어 있다는 특징이 있습니다. 염증이 지속되면, 드물지만 협착, 천공 등의 합병증이 발생할 수 있고, 만성염증의 결과로 대장암이 발생할 수도 있습니다. 하지만 궤양성 대장염을 정확히 진단받고 환자와 의료진의 공동노력으로 꾸준히 치료와 관리를 하면, 일반인과 차이없는 삶의 질과 수명을 유지할 수 있습니다. 종류 궤양성 대장염은 염증의 .. [Python] 3. 데이터 다루기 - 숫자 * 기록용입니다. 데이터 다루기 - 변수(Variable) : 데이터가 담기는 공간 - 주석(Comment) : 앞에 #을 쓰면 해당 줄은 주석처리 된다. ** 띄어쓰기는 상관없음 1. 숫자 데이터 - 숫자형 데이터란, 정수/실수/복소수/2진수/8진수/16진수를 포함하며 가장 많이 사용하는 데이터 타입 - 파이썬은 숫자의 표현범위가 무한대이다. 1) 정수(Integer) 2) 실수(Floating point) 3) 사칙연산 해보기 4) 특수연산 : 승수, 몫과 나머지 이전 1 2 3 4 다음