반응형

Python/PYTHON NumPy & Pandas 7

[pandas] 보여주는 데이터 열 개수 변경하기; pd.options.display.min

pd.read_csv로 파일을 열고 나면, 판다에서 보통 10개 정도 데이터 열을 보여준다. 근데 가끔 아 "데이터 열 좀 더 혹은 덜 보고 싶은데"라는 느낌이 들 때가 있다. 물론 이 때는 head라는 명령어를 통해서 보여주는 열 수를 조정할 수 있는 게 일반적. 예를 들어 내가 gas라는 데이터프레임을 열었다고 해보자. gas=pd.read_csv("incident_gas_transmission_gathering_jan2010_present.csv") gas.head(3) 이렇게 하면 아래처럼 딱 세 열만 보여준다. 당연히 gas.head(20)으로 하면 20개 보여줄 것이고. 그런데 이런 head 명령어 사용하지 말고 그냥 데이터프레임 딱 치면 기본적으로 보여주는 열 갯수 옵션을 바꾸고 싶다고 하면..

[pandas] 행, 열 합(sum) 구하기

revenue=pd.read_csv("revenue.csv", index_col="Date) revenue라는 데이터 열고 그 중 맨 처음 칼럼인 날짜 칼럼을 인덱스 칼럼으로 지정합니다. 일반적으로 더하는 기능은 .sum입니다. 위의 데이터프레임에 revenue.sum을 하면 각 칼럼마다의 총합을 보여줍니다. 만약에 각 열(row)별로 합을 구하고 싶다고 하면 revenue.sum(index=1)을 해주면 됩니다 (기본은 index=0으로 되어 있음). revenue.sum(index=column)으로 해도 같은 결과입니다. (열 간의 합) index는 거기를 고정시켜준다는 개념으로 보면 되요~

[pandas] 데이터프레임 속성 확인 명령어들

nba=pd.read_csv("nba.csv") #nba 파일을 불러서 nba 이라는 이름을 줍니다. nba.head(): 첫 5열 보여줌 nba.head(10): 첫 10열 보여줌 nba.tail(): 마지막 5열 보여줌 nba.tail(7): 마지막 7열 보여줌 nba.index: row의 갯수를 얘기해줌. 예를 들어 0에서부터 459까지 있는데 1씩 있다. 이런 식으로. nba.values: 각 row를 array (tuple)단위로 묶어셔 몇 개 보여줌. (numpy array에 기반) nba.shape: row, column 수 한 번에 보여줌 #유용! nba.dtypes: 각 column의 속성을 보여줌; object, float64, .. nba.dtypes.value_count: objec..

[function연습] 두 단어의 앞글자가 같으면 true, 아니면 false

.split 함수를 써서 쪼개고 (여기서는 두 단어만 있다고 가정 예를 들어 fat cat같은) 그 다음에는 리스트 개념. 쪼갠 다음 첫번째 단어랑 (wordlist[0], fat), 두번째 단어를 정하고 (wordlist[1], cat), 그 다음에 첫번째 스펠링, 두번째 스펠링 비교. def same_letter(text): wordlist=text.split() print(wordlist) first=wordlist[0] second=wordlist[1] return first[0]==second[0] 더 간단하게는 아예 첫번째 단어, 첫번째 스펠 한 번에 쭉 적음 wordlist[0][0] def same_letter(text): wordlist=text.split() print(wordlist)..

Python numpy/pandas library 들어가기에 앞서

저도 이제 막 파이썬에 입문한 사람으로 파이선에서 가장 많이 사용되는 library 둘, numpy와 pandas library에 관한 중요 내용들을 요약하려 합니다. 아래 링크를 보시면 아시겠지만 파이썬에서 가장 많이 사용되는 top 10 라이브러리에 이 둘이 들어가 있고, 아마 데이타 사이언스 하는 분들이라면 거의 기본적으로 이용하는 라이브러리라고 봐도 무방할 듯 합니다. https://towardsdatascience.com/top-10-python-libraries-for-data-science-cd82294ec266 Top 10 Python Libraries for Data Science Some cool help for your Data Science explorations! towardsda..

반응형