'분류 전체보기' 카테고리의 글 목록 (7 Page)

ggplot2 - geom_histogram 으로 히스토그램 그래프 만들기

ggplot 에서는 막대그래프를 그리는 여러가지 방법이 있다. geom_bar, geom_col, geom_histogram 이 있는데, 대부분 geom_col 을 가지고 처리하지만, 이번에는 geom_histogram 으로 그려보려 한다. 최종결과는 아래와 같은데, geom_col 로 만든거랑 별반 다르지 않다. 다만, 데이터를 굳이 group by 해서 집계를 하지 않아도 알아서 count 를 세어 빈도를 그래프로 자동으로 만들어주는 장점이 있다. 저번 포스팅에서도 언급한 rent 데이터셋을 그대로 이용하는데, 별도의 그룹핑 집계를 하지 않도록 한다. ggplot2 막대그래프 만들기 아래와 같이 막대그래프를 만들어보고자 한다. 컨셉은, 가장 높은 막대에만 가장 진한색상으로 강조하고, 년도와 건수로 더..

개발/R 2022. 7. 9. 00:18

ggplot2 막대그래프 만들기

아래와 같이 막대그래프를 만들어보고자 한다. 컨셉은, 가장 높은 막대에만 가장 진한색상으로 강조하고, 년도와 건수로 더 강조해본다. #tidytuesday 에서 데이터를 하나 가져와서 샘플로 사용한다. 샌프란시스코를 기준으로 년도별 건수만 집계해놓는다. rent % filter(city == 'san francisco') %>% group_by(year) %>% summarise(count = n()) %>% arrange(year) 우선 세줄 정도의 코딩으로 간단한 막대그래프를 만들수 있다. 하지만 디자인이 아쉽다. ggplot(rent_sanfrancisco, aes(year, count, fill = count)) + geom_col() + theme(legend.position = "none") ..

개발/R 2022. 7. 7. 23:59

postgresql 을 docker 로 설치하기

postgresql 을 좋아하는 이유는 다른거 없고, 라이센스가 소스를 변경하고 재배포를 해도 법적으로 문제가 없다는데 있다. 자세한 설명은 아래 링크를 참고하면 좋을 듯 하다. PostgreSQL ••• PostgreSQL 데이터베이스 서버에 대한 소개글 입니다. postgresql.kr 데이터베이스 postgresql 을 설치하는건 로컬 pc 에 직접 설치를 해도 되지만, docker 를 이용하면 더 독립적으로 서비스를 설치하고 간편하게 관리할 수 있다. 우선 첫째로, docker image 를 만들 Dockerfile 준비한다. 내게 필요한 vim / git / zsh 등을 설치하고, 대략 locale 설정이나 timezone 설정까지만 해놓으면 된다. FROM postgres:14.4-bullse..

개발/docker 2022. 7. 7. 20:57

ggplot2 범례 정보 설정하기

선그래프를 그릴때, 선의 높이에 색을 입히는 작업을 했었다. 이번에는 색의 변화에 대한 범례(legend)를 설정하는걸 정리해본다. 아래 포스팅을 참고하면, scale_colour_gradient 를 이용해서 컬러를 지정하는데, 여기에 몇가지 옵션을 설정하면 범례의 표현을 다양하게 할 수 있다. ggplot2 선그래프에 색깔 변경하기(scale_colour_gradient) 선그래프를 그릴때 선에 y 축값에 따라 색을 입히고 싶다면, colour 를 설정만 하면 된다. 아래 소스에보면, colour = dsci2 로 y축값을 입력했다. 그러면 디폴트로 파란 계열의 색상이 셋팅된다. 참고 emflant.tistory.com 디폴트로 아무것도 설정하지 않으면 알아서 셋팅된다. 현재 200, 300, 400,..

개발/R 2022. 6. 21. 00:26

ggplot2 막대그래프에 그라데이션 효과 주기

막대그래프에 색을 지정할때, 하나만 할 수 있거나 아니면 특정 변수를 매핑해서 변화를 줄수는 있으나, 그라데이션 효과를 주려하면 마땅한 옵션을 찾을 수가 없다.(못찾은 것일 수도 있다..) 약간 임의로 데이터를 쪼개서 잘 지정만 한다면 아래와 같이 y 값이 높을수록 더 진한 빨강으로 매핑하는 등의 효과를 줄 수 있다. 핵심은 데이터의 가공처리방법이다. 이렇게 만들기 전에, 쉬운 예제를 하나 만들어서 데이터를 이해해야 한다. a/b/c 구분별로 1 을 3개씩 가지고, 나머지 z 는 색상의 변화를 위해서 cumsum 처리한 x 필드별로 누적합산필드이다. tb_0 = tibble(x = c("A", "B", "C", "A", "B", "C", "A", "B", "C"), y = c(1,1,1,1,1,1,1,1..

개발/R 2022. 6. 20. 00:12

ggplot2 선그래프에 색깔 변경하기(scale_colour_gradient)

선그래프를 그릴때 선에 y 축값에 따라 색을 입히고 싶다면, colour 를 설정만 하면 된다. 아래 소스에보면, colour = dsci2 로 y축값을 입력했다. 그러면 디폴트로 파란 계열의 색상이 셋팅된다. 참고한 데이터는 여기에서 받아 사용하였다(tidytuesday) ggplot(drought_fips2_ak_f, aes(x = year2, y = dsci2, group = 1, colour = dsci2))+ geom_line(size = 1) + theme_void(base_family = "AppleSDGothicNeo-ExtraBold") + theme( plot.background = element_rect(fill = "#F1F0EA", color = "#F1F0EA"), plot.ma..

개발/R 2022. 6. 18. 00:55

ggplot2 음수/양수 막대그래프 예제

막대그래프를 그리다보면, 음수/양수가 혼재된 막대그래프를 그려야 할 때가 있다. 막대그래프위에 숫자표기를 해서 수치를 강조해볼까 한다. 그리고 마지막에 약간의 디자인을 조정해서 오른쪽처럼 변경해볼까 한다. #tidytuesday 데이터 일부를 가져와서 활용하고자 한다. industry 를 그룹핑해서 랭킹 상승/하락의 sum 을 구해서 22년과 21년대비 어느산업이 더 순위가 상승했는지 알아보는 차트를 만들어보고자 한다. poll % filter(year == 2021) %>% group_by(industry) %>% summarise(n_total = sum(replace_na(change,0))) %>% filter(n_total != 0) %>% mutate(pos = n_total >= 0) %>%..

개발/R 2022. 6. 16. 00:03

ggplot2 막대그래프 정렬하기(오름차순, 내림차순)

일반적으로 데이터를 가공하지 않은 상태로 막대그래프를 그리면, 아래와 같이 뒤죽박죽 나오게 된다. 보는데 문제는 없지만, 그래프를 딱 봤을때, 최소/최대값이 무엇인지 눈으로 비교하면서 찾아야 하는 불편함이 있다. 아래 처럼 막대그래프를 정렬하면, 어느값이 가장 높은지 낮은지 비교하며 찾을 필요없이 가장 우측 혹은 좌측을 주시하게 되면서 훨씬 이해하기 쉬운 그래프가 된다. 정렬의 기술을 알기전에, 우선 샘플 데이터를 하나 가져온다. tidytuesday 데이터를 하나 가져다 쓴다. 데이터의 설명은 여기를 클릭해서 참고 바란다. library(patchwork) library(tidyverse) pride_aggregates % janitor::clean_names() %>% filter(company !=..

개발/R 2022. 6. 15. 00:05

프로그래밍 일지

티스토리툴바

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31