본문 바로가기

✨ python16

파이썬(python) - flask 플라스크 세팅하기 먼저 작업하고자 하는 프로젝트에 가서 venv를 생성해야한다. git bash를 열어서 만들어 주자. python -m venv venv -> 폴더에 venv 라는 가상환경 폴더 명을 만든다. source ./venv/Scripts/activate -> venv에 있는 가상환경 폴더로 들어간다. deactivate - > 가상 환경에서 벗어난다. * 작업을 해야하니 벗어나지는 말자. 윈도우 검색창에서 IDEL를 열어주면 이렇게 열리게 된다. 새로운 파일을 만들어 위와 같이 쳐주면 포트번호로 서버가 실행된다. HTML 삽입 미리보기할 수 없는 소스 python app.py 를 쳐보고, 가상환경 안에는 있는게 없어서 해당 모듈에 해당되는 것들은 다운받아줘야한다. pip install flask 를 쳐서 모듈.. 2023. 6. 1.
파이썬(python) - 데이터 시각화(Matplotlib) - 01 데이터 시각화 (Matplotlib) => 다양한 형태의 그래프를 통해서 데이터를 시각화 라이브러리 import matplotlib import matplotlib.pylab as plt matplotlib.rcParams['font.family'] = 'Malgun Gothic' matplotlib.rcParams['axes.unicode_minus'] = False 이후 이런식으로 x와 y값을 넣어주고 데이터를 추출해낼 수 있다. 막대 그래프 이런식으로 데이터를 시각화하여 차트모형으로 나타낼 수도 있다. 2023. 5. 23.
파이썬(python) - 데이터 분석(pandas) - 04 [결측치] 결측치 = 비어있는 데이터 이번에도 위 엑셀 파일을 불러와 실습해보았다. # dropna 함수의 매개변수 정보 # 매개변수로 axis, how 존재 # ex > drop (axis = ? , how = ? ) # axis에는 'index', 'columns' # axis = 'index' -> NaN 데이터를 갖는 행 삭제 # axis = 'columns' -> NaN 데이터를 갖는 컬럼 삭제 # how 에는 'all' , 'any' # how = 'all' 모든 데이터가 NaN이면 삭제 # how = 'any' NaN 데이터가 하나라도 있으면 삭제 2023. 5. 23.
파이썬(python) - 데이터 분석(pandas) - 03 위 엑셀의 데이터들을 파이썬에서 pandas로 불러왔다. index_col ='학번' 을 이용해서 인덱스열을 학번으로 지정해주었다. 데이터 선택(iloc) 위치를 이용하여 행과 열을 조회 데이터 선택(조건 검색) 이런식으로 엑셀에 있는 데이터들을 이용해 데이터 분석을 진행해보았다. 2023. 5. 23.
파이썬(python) - 함수 (def) 파이썬에서 함수의 선언은 def 함수명() : 으로 시작한다. 파이썬에서 함수의 시작과 끝은 들여쓰기로 판단한다. 예시 문제 ) # 첫번째 매개변수 : 정수만 들어있는 리스트 # 두번째 매개변수 : 정수 # 첫번째 매개변수로 들어온 리스트의 모든 요소의 값을 두번째 매개변수로 나눈 나머지의 합을 리턴하는 함수 # [1,2,3], 2 => 1,0,1 -> 2 리턴 이렇게 함수를 사용하여 출력된 결과값을 도출해 낼 수 있다. 2023. 5. 23.
파이썬(python) - 데이터 분석(pandas) - 02 경로에 있는 엑셀 파일을 한번 들고와보자. pd.read_excel('파일명.xlsx') 을통해 불러들였고, index_col='학번' 으로 학번을 기본 인덱스로 갖도록 불러도 와보았다. 2023. 5. 17.
파이썬(python) - 데이터 분석(pandas) - 01 먼저 pandas를 import 해오고, as 별칭으로 pd를 써주었다. 따라서 pandas.DataFrame(data) 대신에 pd.DataFrame(data)를 써서 사용할 수 있다. 그리고 인덱스를 초기화 시키기 위해 reset_index()를 쓸 수있는데, 아까 추가해준 학번이 기본 컬럼으로 오면서 삭제가 제대로 안되있다. ( 지운 척 한거다.) 얘는 인덱스를 초기화 하면서 기존 인덱스 컬럼을 삭제해줄 수 있다. 단, 반드시 inplace=True를 주어야 DB로 말하자면 커밋이 완료되면서 제대로 삭제까지 완료된 것이다. . 2023. 5. 17.
파이썬(python) - 웹크롤링, Selenium Selenium 라이브러리를 활용한 클릭, 키 입력 이벤트 다음 싸이트에 Selenium을 이용해서 로그인을 진행 https://hashcode.co.kr QnA | 프로그래머스 커뮤니티 프로그래머스 QnA는 프로그래밍 문제해결을 위한 QnA서비스입니다. 프로그래밍과 관련해서 개발자들끼리 궁금한건 물어보고 아는건 함께 나눠요. C, Java, Python, Ruby등의 코드를 웹에서 직접 실행 qna.programmers.co.kr 1. 크롬을 실행시켜주는 chromeDriver 설치 이렇게 다운로드 받아준뒤 해당 프로젝트 파일에 압축 푼 폴더를 넣어준다. 이후, pip install selenium 을 설치해준다. 2. 필요한 라이브러리 추가. from selenium import webdriver 으.. 2023. 5. 15.
파이썬(python) - 네이버 뉴스 제목 가져오기 (크롤링) https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=105 IT/과학 : 네이버 뉴스 모바일, 인터넷, SNS, 통신 등 IT/과학 분야 뉴스 제공 news.naver.com 나는 이 네이버 뉴스에서 헤드라인 뉴스를 가지고 오려고 한다. F12를 눌러 태그가 어디에 싸여져 있는지 알아봤는데, a태그의 sh_text_headline 에 쌓여져 있는걸 확인할 수 있다. a태그만 조회해봤는데, 양이 엄청났다. a태그의 텍스트만 조회했는데도 여전히 많다. 이렇게 a에 포함된 클래스를 함께 주기 위해서는 class_ 를 사용할 수 있다. HTML 삽입 미리보기할 수 없는 소스 위에서부터 천천히 살펴보자. 1. 헤드라인 뉴스와 나머지 뉴스를 모두 포함한 Di.. 2023. 5. 12.
파이썬(python) - 크롤링(Crawling) 또는 스크래핑(Scraping) - 2 http://books.toscrape.com/catalogue/category/books/travel_2/index.html Travel | Books to Scrape - Sandbox £56.88 In stock books.toscrape.com 해당 페이지의 책 제목들을 들고와보자. a태그 위의 h3태그로 감싸져있는 것을 볼 수 있다. HTML 삽입 미리보기할 수 없는 소스 이러면 끝난다.. find_all 을하면 List의 형태로 태그들을 가지고 와준다. 따라서 이렇게 for 문에서 반복시켜주면서 한줄 한줄 데이터를 뽑을 수 있다. 2023. 5. 11.
파이썬(python) - 크롤링(Crawling) 또는 스크래핑(Scraping) 먼저, 파이썬에서 크롤링을 처음한다면, pip install bs4 를 통해 설치를 해줘야한다. https://www.pythonscraping.com/pages/warandpeace.html 2023. 5. 11.
파이썬(python) - 딕셔너리(Dictionary) 이번에는 데이터의 사전이라고도 불리는 딕셔너리에 대해서 알아보았다. 키: 값 쌍으로 구성되는 json과 비슷한 형태이며 데이터 사전에 데이터들을 저장해 놨다가 필요할 때마다 값들을 불러와 사용할 수 있는 방식이다. { 'name' : ['홍길동', '이순신'], 'age' : [40,50], 'score' : [80, 90] } 이와 같은 데이터를 갖는 딕셔너리를 만드는데 모든 키와 값은 키보드로 입력받아 생성. . 이름, 나이, 국어점수, 영어점수를 데이터로 갖는 student 딕셔너리를 만드시오. 각 데이터는 키보드로 입력받아 저장하고, 저장된 데이터를 출력하시오 위 문제에서 만든 딕셔너리 데이터에 총점 데이터를 추가하시오. 총점 데이터는 국어,영어 점수의 합으로 들어가야합니다. 2023. 5. 8.