본문 바로가기 메뉴 바로가기

기록은 기억을 지배한다

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

기록은 기억을 지배한다

검색하기 폼
  • 분류 전체보기 (138)
    • 알고리즘&자료구조 (11)
    • HTML+CSS (3)
    • React (3)
    • Python (16)
    • Java (2)
    • DataBase (1)
    • 클라우드 (3)
    • Ubuntu(Linux) (23)
    • 영상처리 (12)
    • ML | DL (29)
    • MLOps (3)
    • 개발 기타 (28)
    • 개인 기타 (4)
  • 방명록

dataframe (1)
Pyarrow로 csv데이터 빨리 읽기 (with Pandas)

Pyarrow로 csv데이터 빨리 읽기 (with Pandas) pyarrow아파치 애로우(Apache Arrow)라는 메모리 내 분석을 위한 개발 플랫폼인데, 빅데이터를 빠르게 처리하고 이동할 수 있도록 하는 일련의 기술을 제공하는 라이브러리를 파이썬 PyArrow를 통해 구현할 수 있다.기존의 pandas로 용량이 큰 csv파일을 로드하면 시간이 오래 걸리는데, pyarrow를 활용하면 시간 절약에 도움이 된다. pyarrow 설치pip을 이용하여 아래 명령어로 쉽게 설치 할 수 있다.$ pip install pyarrow csv 파일읽기아래 코드로 csv 파일을 읽어 pandas 데이터프레임으로 쉽게 변환할 수 있다.from pyarrow import csv df = csv.read_csv('dat..

Python 2021. 1. 15. 22:16
이전 1 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory
  • 분류 전체보기 (138)
    • 알고리즘&자료구조 (11)
    • HTML+CSS (3)
    • React (3)
    • Python (16)
    • Java (2)
    • DataBase (1)
    • 클라우드 (3)
    • Ubuntu(Linux) (23)
    • 영상처리 (12)
    • ML | DL (29)
    • MLOps (3)
    • 개발 기타 (28)
    • 개인 기타 (4)

  • 방명록

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.