반응형

전체 글 53

[pandas] iloc와 loc 인덱싱, 사용법과 차이점

ilocloc기준정수 인덱스 기반 (integer-location)라벨(Label) 기반용도데이터 프레임의 위치를 기준으로 데이터 선택행과 열의 라벨을 사용하여 데이터 선택범위0부터 시작하는 정수 인덱스 사용데이터 프레임의 인덱스와 컬럼 이름 사용유형슬라이싱 시 Python 스타일 범위 사용슬라이싱 시 끝 값도 포함 (Inclusive) 1. iloc: 정수 인덱스 기반 데이터 선택iloc은 데이터 프레임의 행과 열을 정수 인덱스를 사용하여 선택한다. 기본 문법DataFrame.iloc[행_인덱스, 열_인덱스] 예시 데이터프레임 Name Age City0 Kim 25 Busan1 Lee 28 Daegu2 Jeon 35 Seoul..

Python 2025.01.09

[MySQL] 정규 표현식 (REGEXP) 사용법, 관련 함수

1. REGEXP 문자열이 특정 정규 표현식 패턴과 일치하는지 확인하는 연산자column_name REGEXP 'pattern'column_name: 검색할 열pattern: 정규 표현식 패턴-- 문자열에 'apple'이 포함된 경우 찾기SELECT * FROM table_name WHERE column_name REGEXP 'apple';-- 숫자로만 구성된 문자열 찾기SELECT * FROM table_name WHERE column_name REGEXP '^[0-9]+$';-- 특정 접두사로 시작하는 문자열SELECT * FROM table_name WHERE column_name REGEXP '^prefix';-- 특정 접미사로 끝나는 문자열SELECT * FROM table_name WHERE ..

카테고리 없음 2024.12.29

[MySQL] FIRST_VALUE(), LAST_VALUE(), NTH_VALUE()

윈도우 함수 중 FIRST_VALUE(), LAST_VALUE(), NTH_VALUE() 함수에 대해 알아보겠습니다. 이용할 데이터 예시swimmerevent_daterace_timewoo2024-10-0152.3woo2024-10-0350.5woo2024-10-0551.1gyoung2024-10-0156.7gyoung2024-10-0255.9 FIRST_VALUE()윈도우 내에서 첫 번째 값을 반환합니다.SELECT swimmer, event_date, race_time, FIRST_VALUE(race_time) OVER (PARTITION BY swimmer ORDER BY event_date) AS first_race_timeFROM swimming_races;swimmerevent_..

Database/MySQL 2024.12.16

[Tableau] MySQL 서버에 연결하기

데이터베이스를 만든 김에 태블로에서도 연결해 보고 싶어서 시도 ~ 현재는 설치 완료되어서 캡쳐가 불가능해 다른 걸로 대체MySQL도 위와 같이 드라이버를 설치해야한다고 나와서 드라이버 다운로드로 이동  MySQL을 찾아서 MySQL Community Downloads 누르면 아래의 사이트로 이동 MySQL :: Download Connector/ODBCConnector/ODBC is a standardized database driver for Windows, Linux, Mac OS X, and Unix platforms Online Documentation: The latest MySQL Connector/ODBC version is recommended for use with MySQL Server..

Tableau 2024.12.12

[pandas] transform 함수로 데이터 변환하기

pandas.DataFrame.transform은 데이터프레임을 변환할 때 매우 유용한 메서드입니다. 이 메서드는 데이터를 열 또는 행 단위로 변환하며, 원본 데이터프레임과 동일한 크기를 가진 결과를 반환해야 합니다. 이 글에서는 transform의 개념, 활용 예시, 주요 매개변수 등을 다룹니다.pandas.DataFrame.transformDataFrame.transform(func, axis=0, *args, **kwargs)데이터프레임의 각 열 또는 행에 대해 변환 함수를 적용하여 동일한 크기의 데이터프레임을 반환변환된 결과는 원본 데이터프레임과 동일한 크기열(column) 또는 행(row) 단위로 변환 수행그룹화(groupby)와 함께 자주 사용다양한 입력 유형(function, str, lis..

Python 2024.12.11

[pandas] groupby 정리

pandas.DataFrame.groupby데이터를 그룹화하고, 그룹별로 연산을 수행할 수 있도록 돕는 함수분할(splitting), 적용(applying), 결합(combining) 의 과정더보기1. 그룹화의 세 단계- 분할(Splitting): 특정 기준에 따라 데이터를 여러 그룹으로 나눔- 적용(Applying): 각 그룹에 독립적으로 함수를 적용- 결합(Combining): 각 그룹에서 계산된 결과를 하나의 데이터 구조로 결합 2. 적용 단계 세 가지 유형- 집계(Aggregation): 각 그룹에 대한 요약 통계량 계산 (예: 합계, 평균 등)- 변환(Transformation): 특정 계산 수행 후 원래와 동일한 인덱스를 가진 객체 반환. (예: 그룹 별 표준화 혹은 결측치 보완)- 필터링(F..

Python 2024.12.11

[pandas] 데이터 병합 - merge, join

DataFrame.mergeDataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=None, indicator=False, validate=None) 두 데이터프레임 또는 시리즈를 병합하여 하나의 데이터프레임 생성시리즈의 경우 기본적으로 인덱스를 이용하여 병합* 주의 두 키 컬럼에 null 값이 있을 경우, 해당 행끼리 매칭 Parameters:1. right : 병합할 대상 DataFrame 또는 Series 객체 2. how (default 'inner') : 병합 방식 설정'left': ..

Python 2024.12.06

[pandas] DataFrame.rank, 관련 문제 Leetcode 《178. Rank Scores》

DataFrame.rank(axis=0, method='average', numeric_only=False, na_option='keep', ascending=True, pct=False)Parameters:1. axis(default 0) : 순위를 계산할 축 설정Series의 경우 이 파라미터 사용되지 않음DataFrame의 경우- 0, ‘index’ : 각 행 내에서 순위를 부여- 1, ‘columns’ : 각 열 내에서 순위를 부여2. method(default ‘average’) : 동일한 값(ties)에 순위를 할당하는 방식'average' : 평균 순위 (1, 2.5, 2.5, 4, ...)'min' : 낮은 순위 (1, 3, 3, 4, ...)'max' : 높은 순위 (1, 2, 2, 4,..

Python 2024.12.03

[Tableau] 태블로의 작업 순서, Order of Operations

Order of Operations: Tableau에서 데이터가 처리되는 순서를 나타내며,필터나 계산과 같은 데이터 변환 작업이 어떤 순서로 적용되는지 이해하는 데 중요하다. 그림에 있는 필터 부분의 적용 순서만 정리해서 살펴보았다.   1. Extract Filters- 데이터 추출 시 적용되는 필터- 데이터 크기를 줄이고 성능을 최적화하는 데 유용2. Data Source Filters- 데이터 원본 수준에서 적용되는 필터- 전체 워크북에 영향, 분석에 사용할 수 있는 데이터 제한3. Context Filters- 다른 필터보다 먼저 적용되어 데이터의 하위 집합을 정의- 이후의 필터들은 이 컨텍스트 내에서만 작동4. Dimension Filters - Sets, Conditional, Top N Fi..

Tableau 2024.11.19

[Tableau] 도넛차트, 지도, 카테고리 별 비율, 데이터 숨기기

완성 화면  도넛차트 만들기1. 파이차트 만들기2. 열이나 행선반에 비어있는 필드 생성 후 복제3. 복제된 차트의 마크 원형 선택 후 구성 비율 레이블 추가4. 표시하고 싶은 레이블 '항상 표시' > 가운데 맞춤5. 이중축 적용하고 원 색상, 크기 조정  지도지리적 역할 변경 후 올리기만 하면 지도 생성됨  카테고리별 비율특정 차원에 대한 테이블 계산 > 데이터 숨기기

Tableau 2024.11.19
반응형