Today I learned

2020.02.09

Git basic command

git init:Initialize repositury
.git : repository
git status : working tree status
git add : add to staging area
git add . : add all files to staging area
git commit : create version
git commit -m "Message"
git commit -am "Message" : add + commit
git log : show version
git log -stat
git log -p
git diff
git checkout commit-ID
git checkout master

Change git editor

git config --global core.editor "nano"

Reset

git reset --hard commit-ID
git reset --soft commit-ID

Display log(branch)

git log --all --grape -- oneline

Correct coCcommit massage

git commit --amend

2020.03.12

Git remote

git init
git remote add origin "http adress"
git pull origin master
git add *
git commit -m "Message"
git push --set-upstream origin master

2020.03.20

pyc compile(pyc_compile.py)


import py_compile  
py_compile.compile('py file name')

bat file(2 python versions)

C:\Anaconda3\python.exe pyc_compile.py
C:\Anaconda3\envs\python36\python.exe pyc_compile.py

2020.03.23

DataFrame Error Fix

ValueError: If using all scalar values, you must pass an index
참조


import pandas as pd  
df = pd.DataFrame({'col_1': 1, 'col_2': 2})

add an index


df = pd.DataFrame({'col_1':1, 'col_2':2}, index=[0])

use a list instead of scalar values


df = pd.DataFrame({'col_1':[1], 'col_2':[2]})

use pd.DataFrame.from_records() with a list


df = pd.DataFrame.from_records([{'col_1':1, 'col_2':2}])

use pd.DataFrame.from_dict([]) with a list


df = pd.DataFrame.from_doct([{'col_1':1, 'col_2':2}])

2020.03.27

동적 변수 생성


data = ["first", "second", "third"]
for name in data:
    for i in range(1,4):
        globals()[name] = [x*i for x in range(3)]

2020.03.28

json 파일 생성


import json

with open('?????.json', 'w', encoding='utf-8') as make_file:

    json.dump(json_data, make_file, indent="\t")

json 파일 open


import json

with open('?????.json', 'r') as f:

    admin_info = json.load(f)

print(admin_info)

환경변수 불러오기


import os

admin_info_file = os.getenv('NAME')

2020.04.02

Numpy Zero-like


>>> x = np.arange(6)
>>> x = x.reshape((2, 3))
>>> x
array([[0, 1, 2],
       [3, 4, 5]])
>>> np.zeros_like(x)
array([[0, 0, 0],
       [0, 0, 0]])

2020.04.12

Folium Marker icon ref.

https://getbootstrap.com/docs/3.3/components/#glyphicons-glyph

2020.04.15

AWS SSH 연결

cmd / powershell 관리자모드로 실행
ssh -i "AWSKEY.pem" ubuntu@ec2-IP주소.ap-northeast-2.compute.amazonaws.com

AWS server 구동

python3 application.py : 파이썬 서버 구동
Ctrl + Z : 프로세스 중지
bg : 백그라운드에서 서버 다시 구동
disown -h : 소유권 포기

중지

netstat -nap | grep {포트 번호}: 특정 포트 번호에서 돌아가는 프로세스를 확인하기
kill -9 {프로세스 번호}: 특정한 프로세스를 종료시키기

추가

jobs : 프로세스 확인
fg : 포어그라운드

key파일없는 PC에서 원격 연결(homepage)

ssh mckam@13.125.57.95
PASSWORD
python3 application.py
Ctrl + Z
bg
disown -h

2020.04.16

KAKAO MAPS API

Geocoding


url = 'https://dapi.kakao.com/v2/local/search/address.json?query='+addr
headers = {"Authorization": "KakaoAK {Private Key}"}
result = json.loads(str(requests.get(url,headers=headers).text))

if len(result['documents']) !=0:
    match_first = result['documents'][0]['address']
    return float(match_first['y']),float(match_first['x'])
else:
    return None, None

2020.05.07

install python anaconda 32bit envs

set CONDA_FORCE_32BIT=1
conda create -n XXXXXXX python=3.7 anaconda

To activate envs.

conda activate XXXXXXX

To deactivate an active envs.

conda deactivate

2020.05.18

pandas string


# 공백 제거
df['email_strip']  = df['email'].str.strip()  # 앞 뒤 공백을 제거
df['email_lstrip'] = df['email'].str.lstrip() # 앞 공백을 제거
df['email_rstrip'] = df['email'].str.rstrip() # 뒤 공백을 제거

# split(): 구분자를 기준으로 n개로 나눈다, expand=True이면 여러 컬럼, False이면 1개 컬럼에 리스트
df[['email_split_1', 'email_split_2']] = df['email'].str.split('@', n=1, expand=True)

# 치환
df['email_lower']      = df['email'].str.lower()      # 모두 소문자로 변경
df['email_upper']      = df['email'].str.upper()      # 모두 대문자로 변경
df['email_capitalize'] = df['email'].str.capitalize() # 앞문자 대문자로 변경
df['email_title']      = df['email'].str.title()      # 단위별 앞문자 대문자로 변경
df['email_swapcase']   = df['email'].str.swapcase()   # 소문자는 대문자, 대문자는 소문자로 변경 

# 입력 패턴 또는 글자를 대체, 예제에서는 .을 _로 변경
df['email_replace']    = df['email'].str.replace(pat='.', repl='_', regex=False)

# 문자열의 위치(인덱스)
df['email_find']    = df['email'].str.find(sub='.')           # 왼쪽부터 sub값 검색후 위치반환
df['email_findall'] = df['email'].str.findall(pat='[a-zA-Z]') # 찾은 모든 값 반환
df['email_rfind']   = df['email'].str.rfind(sub='.')          # 오른쪽부터 sub값 검색후 위치반환
df['email_index']   = df['email'].str.index(sub='.')          # 왼쪽부터 sub값 검색후 위치반환
df['email_rindex']  = df['email'].str.rindex(sub='.')         # 오른쪽부터 sub값 검색후 위치반환

# 길이 반환
df['email_len']   = df['email'].str.len()              

# 구성 확인
df['email_isalnum']   = df['email'].str.isalnum()   # 알파벳 또는 숫자로만 구성 여부
df['email_isalpha']   = df['email'].str.isalpha()   # 알파벳으로만 구성 여부
df['email_isdecimal'] = df['email'].str.isdecimal() # 숫자문자로만 구성 여부
df['email_isdigit']   = df['email'].str.isdigit()   # 숫자문자로만 구성 여부
df['email_islower']   = df['email'].str.islower()   # 소문자로만 구성 여부
df['email_isnumeric'] = df['email'].str.isnumeric() # 숫자문자로만 구성 여부
df['email_isspace']   = df['email'].str.isspace()   # 공백(Whitespace)으로만 구성 여부
df['email_istitle']   = df['email'].str.istitle()   # TitleCase형태로 구성 여부
df['email_isupper']   = df['email'].str.isupper()   # 대문자로만 구성 여부

# 문자열 패턴
df['email_startswith'] = df['email'].str.startswith(pat='h')     # 좌측값이 입력패턴과 일치 여부
df['email_endswith']   = df['email'].str.endswith(pat='com')     # 우측값이 입력패턴과 일치 여부
df['email_contains']   = df['email'].str.contains(pat='kr', regex=False) # 값 중 패턴포함 여부
df['email_match']      = df['email'].str.match(pat='[a-zA-Z@.]') # 입력패턴과 일치 여부

2020.05.19

OS Module


# 파일 목록 얻기
glob.glob(wildcard) # 유닉스 경로명 패턴 스타일로 파일 목록을 얻을 수 있다.
os.listdir(path) # 지정된 디렉토리의 전체 파일 목록을 얻을 수 있다.
dircache.listdir(path) # os.listdir(path)와 동일한 파일 목록을 전달한다.

# 디렉토리 다루기
os.chdir(path) #작업하고 있는 디렉토리 변경
os.getcwd() # 현재 프로세스의 작업 디렉토리 얻기

# 파일 이름 다루기
os.path.abspath(filename) # 파일의 상대 경로를 절대 경로로 바꾸는 함수
os.path.exists(filename) # 주어진 경로의 파일이 있는지 확인하는 함수
os.curdir() # 현재 디렉토리 얻기
os.pardir() # 부모 디렉토리 얻기
os.sep() # 디렉토리 분리 문자 얻기

# 경로명 분리하기
os.path.basename(filename) # 파일명만 추출
os.path.dirname(filename) # 디렉토리 경로 추출
os.path.split(filename) # 경로와 파일명을 분리
os.path.splitdrive(filename) # 드라이브명과 나머지 분리 (MS Windows의 경우)
os.path.splitext(filename) # 확장자와 나머지 분리

2020.05.21

datetime


import datetime
 
now = datetime.datetime.now()
print(now)          # 2018-07-28 12:11:32.669083

nowDate = now.strftime('%Y-%m-%d')
print(nowDate)      # 2018-07-28
 
nowTime = now.strftime('%H:%M:%S')
print(nowTime)      # 12:11:32
 
nowDatetime = now.strftime('%Y-%m-%d %H:%M:%S')
print(nowDatetime)  # 2018-07-28 12:11:32

2020.06.02

Class member variable


A. dir
class Obj:
    def __init__(self):
        self.x = 9
obj=Obj()
print( dir(obj) )
>>> ['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'x']

B. __dict__
print(obj.__dict__)
>>> {'x': 9}

변수 존재 확인

Try / Exception


try : 
     thevariable
exception NameError :
     print('The variablle wasn't defined'_
else :
     print('It is defined')

variable


if 'myVar' in locals(): # local variable 일 경우
if 'myVar' in globals(): # global variable 일 경우
if  hasattr(obj,'attr_name') : # obj name이 존재할 경우

2020.06.08

AWS EC2 ubuntu 유저 생성(pem 파일없이 패스워드 사용 접속)

sudo useradd -s /bin/bash -m -d /home/mckam -g root USERNAME

sudo passwd USERNAME PASSWORD

sudo chmod u+w /etc/sudoers

sudo nano /etc/sudoers USERNAME ALL=(ALL:ALL) ALL

sudo nano /etc/ssh/sshd_config PasswordAuthentication yes

sudo service ssh restart

ssh USERNAME@IP ADRESS PASSWORD

2020.06.23

Pandas DataFrame 중복제거


df.drop_duplicates([A, B], keep='first') # A, B : 중복 여부 기준 Columns

Pandas DataFrame index 초기화


df.reset_index(drop=True)

2020.06.27

리스트형 내에서의 임의의 외부 숫자 위치 확인


A = [1,4,6,7]
num = 5

A.append(num)
A.sort()
pos = A.index(num)
A.remove(num)

2020.06.29

파일 실행


import os

os.startfile(filename)

2020.07.13

구글스프레드시트 주식 데이터 받기

GOOGLEFINANCE

KOSPI 지수 10일 데이터 =GOOGLEFINANCE("KRX:KOSPI", "price", Today()-10, Today(), "DAILY")
KOSDQ 지수 20일 데이터 =GOOGLEFINANCE("KOSDAQ:KOSDAQ", "price", Today()-20, Today(), "DAILY")
KOSPI 종목 현재가 =GOOGLEFINANCE("KRX:035720")
KOSDAQ 종목 현재가 =GOOGLEFINANCE("KOSDAQ:258790")
NASDAQ 종목 현재가 =GOOGLEFINANCE("NASDAQ:SBUX")
NYSE 종목 현재가 =GOOGLEFINANCE("NYSE:DIS")

2020.07.14

SQLite3 데이터 중복 제거

"DELETE FROM ??? WHERE rowid NOT IN (SELECT Max(rowid) FROM ??? GROUP BY TITLE order by TITLE)"
"DELETE FROM Holiday WHERE rowid NOT IN (SELECT Max(rowid) FROM Holiday GROUP BY Holiday order by Holiday)"

2020.07.15

SQLite3 DataFrame 저장

df.to_sql('table', conn, if_exists='replace', index=False)

2020.07.16

SQLite3 query


select 시장구분, 종목코드, 종목명, 주식수, 전일종가, 전일종가*주식수 as 시가총액  
            from 종목코드    
            order by 시장구분, 종목코드

2020.07.20

크롤링 requests SSLError 해결

requests.get(url, verify=False)

2020.08.08

Pandas Sorting


df.sort_values(by="A", ascending=False) # ascending=False : 내림차순
df.sort_values(['rank', 'rank1', 'rank2'], ascending=[True,True,True])

Pandas Rank


df['rank1'] = df['A'].rank(ascending=False)

2020.09.15

Pandas String to DateTime


df['col'] = pd.to_datetime(df['col'])
pd.to_datetime(pd.Series(['05/23/2005']))
pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")

2020.09.25

SQLite3 query


query = """
    SELECT A.날짜, A.기간구분, A.종목코드, C.종목명, B.종가, A.매출액, A.영업이익, A.당기순이익, A.자산총계, A.부채총계, A.자본총계, A.자본금, 
        A.부채비율, A.유보율, A.영업이익률, A.순이익률, A.ROA, A.ROE, A.EPS, A.BPS, A.DPS, A.PER, 1/A.PER as RPER, A.PBR, A.발행주식수, A.배당수익률, C.종목상태
    FROM 재무정보 A, (select 종목코드, 종가 from 일별주가 where 일자 = (select max(일자) from 일별주가 where 일자 <= '%s')) B, 종목코드_주식 C
    WHERE 날짜='%s' and 기간구분='%s' and A.종목코드=B.종목코드 and A.종목코드=C.종목코드
    """ % (날짜, 날짜, 기간구분)

2020.09.30

R


library(boot)
data(nodal)
data(nodal)
a<-c(2,4,6,7)
data <- nodal[,a]
glmModel <- glm(r~., data=data, family = "binomial")
summary(glmModel)


Moving Averages
Calculate various moving averages (MA) of a series.
SMA(x, n = 10, ...)


주성분분석 PCA(Principal Component Analysis)
college_s <- scale(college)
summary(college_s
fit <- princomp(college_s)
fit$loadings


# 최적회귀_변수선택법
step(lm(출력변수~입력변수, 데이터세트), scope=list(lower=~1, upper=~입력변수), direction="변수선택방법")
# 예제
step(lm(y~1, data=df), scope=list(lower=~1, upper=~x1+x2+x3+x4), direction="forward")

2020.10.05

R


# 연관성 분석 apriori(arules 패키지)
> data(Groceries)
> inspect(Groceries[1:3])
> rules <- apriori(Froceries, parameter=list(support=0.01, confidence=0.3))
> inspect(sort(rules, by=c("lift"), decreasing=TRUE)[1:20])


# 군집분석(k-means)
> data(iris)
> newiris <- iris
> newiris$Species <- NULL
> kc <- kmeans(newiris, 3)
> table(iris$Species, kc$cluster)
> plot(newiris[c("Sepal.Length", "Sepal.Width")], col=kc$cluster)

2020.10.09

R


# reshape 
# 1. melt
> aqm = melt(airquality, id=c('month', 'day'), na.rm=TRUE)
# 2. cast
> a <- cast(aqm, day~month~variable)


# sqldf
> sqldf("select * from [data frame]")
> sqldf("select * from [data frame] limit 10")
> sqldf("select * from [data frame] where [col] like 'char%' ")

2020.10.10

R


# 데이터프레임 조회 
# 1. data.frame에서 바로 조회
> test[test$학과=='경영학과',]
# 2. subset으로 데이터셋 조회
> subset(test, subset=(학과=="경영학과"))

2020.10.15

R


# 반복 
> rep(1,time=5)
> rep(1:4, each=2)
> rep(c, each=2
# 문자 붙이기
> A <- paste("a", "b", "c", sep="-")
> paste(A, c("e", "f"))
> paste(A, 10, sep="")
# 문자열 추출
> substr("Bigdataanalysis",1,4) -> Bigd
# 기초 통계
> mean(변수) # 평균
> sum(변수) # 합계
> median(변수) # 중앙값
> sd(변수) # 표준편차
> var(변수) # 분산
> cov(변수1, 변수2) # 공분산
> cor(변수1, 변수2) # 상관계수
# 파일 읽기
> read.table("파일이름", sep='구분자')
> read.csv("파일이름", header=T)

2020.10.21

R


# 문자열 길이
> nchar("문자열")
# 문자열 연결
> paste("단어1", "단어2", sep='-')
> paste("the pi is approximately", pi)
# 하위문자열 추출
> substr("statistics", 1, 4)
# 날짜 조회
> format(Sys.Data(), '%a') # 요일조회
> format(Sys.Data(), '%b') # 축약된 월이름조회
> format(Sys.Data(), '%B') # 전체 월이름조회
> format(Sys.Data(), '%d') # 두자리 숫자의 일조회
> format(Sys.Data(), '%m') # 두자리 숫자의 월조회
> format(Sys.Data(), '%y') # 두자리 숫자의 연도조회
> format(Sys.Data(), '%Y') # 네자리 숫자의 연도조회
# 날짜 추출
> d <- as.Date("2014-12-25")
> start <- as.Date("2014-12-01")
> end <- as.Date("2014-12-25")
> seq(from=start, to=end, by=1)

2020.10.26

R


# 상관분석
# 분산
> var(x, y=NULL, na.rm=FALSE)
# 공분산
> cov(x, y=NULL, use='everything', method=c('pearson', 'kendall', 'spearman'))
# 상관관계
> cor(x, y=NULL, use='everything', method=c('pearson', 'kendall', 'spearman'))
> rcorr(matrix(data명), type=c('pearson', 'kendall', 'spearman'))

2020.10.28

R


# R 기초 문제
# 1
> x <- 1:100
> sum(x>50)

# 2
> x <- c(1,2,3,NA)
> mean(x)

# 3
> s <- c("Monday", "Tuesday", "Wednesday")
> substr(s, 1, 2)

# 4
> c(2,4,6,8) + c(1,3,5,7,9)

# 5
> set.seed(1000)
> sample(1:1000, 50)

# 6 잘못된 것 찾기
> x<-c(1:4)
> y<-c("apple","banana","orange")
> xy<-x(x,y)
## A. xy는 문자형 벡터
## B. xy의 길이는 7
## C. xy[1] + xy[2]의 결과는 3
## D. xy[5:7]은 y와 동일

# 7 다른 결과 찾기
> A <- cbind(c(1,2,3), c(4,5,6), c(7,8,9))
> colnames(A) <- c("A","B","C")
> rownames(A) <- c("r1","r2","r3")
## A[,"A"}
## A[-c(2,3),]
## A[,1]
## A[, -(2:3)]

# SQL 기초 문제
# 1. ( )는?
SELECT NAME, GENDER, SALARY
FROM CUSTOMERS
WHERE AGE (   ) 20 AND 30

# 2. 해당 SQL문 분석
select customer_name, 고객명, e_customer_name, 고객 영문명
from customer
where e_customer_name like '_A%';

# 3. xy에 대한 설명으로 부적절한 것은?
> x <- c(1:5)
> y <- seq(10,50,10)
> xy <- rbind(x,y)
- 1. 2x5 행렬이다.
- 2. xy[1,]은 x와 동일하다.
- 3. xy[,1]은 y와 동일하다.
- 4. Matrix 타입의 개체이다.

R reshape

melt

melt(MYDATA, id=c("no", "day"))

cast

cast(MD, no+variable~~day) cast(MD, no~~variable, mean) cast(MD, no-variable+day)

2020.11.13

Python openpyxl

1. 엑셀 파일 생성

 
from openpyxl import Workbook

# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 저장
wb.save(fileName)

2. 값 입력

 
from openpyxl import Workbook
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
# 첫번째 입력방법
ws['A1'] = 1
 
# 두번째 입력방법
ws.cell(2,1,'B') # ws.cell(row=2, column=1, value=2)
 
# 세번째 입력방법
ws.append([2,'',4])
 
# 네번째 입력방법
for rng in ws['E1':'F3']:
    for cell in rng:
        cell.value = 'Hello'
 
# 다섯번째 입력방법
for r in range(4,7):
    ws.cell(r,1,'World') # [A4:A6]
 
# 저장
wb.save(fileName)

3. 값 출력

 
from openpyxl import Workbook
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
# 첫번째 입력방법
ws['A1'] = 1
 
# 두번째 입력방법
ws.cell(2,1,'B') # ws.cell(row=2, column=1, value=2)
 
# 세번째 입력방법
ws.append([2,'',4])
 
# 네번째 입력방법
for rng in ws['E1':'F3']:
    for cell in rng:
        cell.value = 'Hello'
 
# 다섯번째 입력방법
for r in range(4,7):
    ws.cell(r,1,'World') # [A4:A6]
 
# 첫번째 출력방법
print(ws['A1'])
 
# 두번째 출력방법
print(ws.cell(2,1).value)
 
# 세번째 출력방법
for rng in ws['E1':'F3']:
    for cell in rng:
        print(cell.value)
 
# 네번째 출력방법
for r in range(4,7):
    print(ws.cell(r,1).value) # [A4:A6]
 
# 저장
wb.save(fileName)

4. 함수 입력

 
from openpyxl import Workbook
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
ws['A1'] = 10
ws['A2'] = 20
ws['A3'] = 30
ws['A4'] = 40
ws['A5'] = '=SUM(A1:A4)' # 합계 함수
 
# 저장
wb.save(fileName)

5. 셀 서식

 
from openpyxl import Workbook
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
# A1 입력 + 형식변경
ws['A1'] = 1000
ws['A1'].number_format = '#,##0'
 
# A2 입력 + 형식변경
ws.cell(2,1,2000).number_format = '#,##0'
 
# B1, B2 입력 + B열 형식변경
ws['B1'] = 3000
ws['B2'] = 4000
for rng in ws['B:B']:
    rng.number_format = '#,##0'
 
# C1:D3 입력 + 형식변경
for rng in ws['C1':'D3']:
    for cell in rng:
        cell.value = 5000
        cell.number_format = '#,##0'
 
# E1, E2, E3 입력 + 형식변경
ws['E1'] = -250
ws['E2'] = 250
ws['E3'] = -300
ws['E4'] = 0
for rng in ws['E1':'E4']:
    for cell in rng:
        cell.number_format = '[RED]#,##0;[BLUE]-#,##0;"-"' # 양수면 빨강 음수면 파랑 0이면 -
 
# 저장
wb.save(fileName)

6. 셀 병합

 
from openpyxl import Workbook
from openpyxl.styles import Alignment
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
# A1:C1 병합
ws.merge_cells('A1:C1')
 
# 가운데맞춤
ws['A1'].alignment = Alignment('center', 'center') # Alignment(horizontal='center', vertical='center') 
 
# A1 입력
ws['A1'] = 'Hello World !'
 
# A1:C1 병합 해제
# ws.unmerge_cells('A1:C1')
 
# 저장
wb.save(fileName)

7. 마지막 행, 열 번호

 
from openpyxl import Workbook
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
# 마지막 행 구하기
print('입력 전: ' + str(ws.max_row))
 
# [A1:A10] 입력
for rng in ws['A1:A10']:
    for cell in rng:
        cell.value = 'Excel'
 
# 마지막 행 구하기
print('입력 후: ' + str(ws.max_row))
 
# 마지막 열 구하기
print('입력 전: ' + str(ws.max_column))
 
# [B1:G1] 입력
for rng in ws['B1:G1']:
    for cell in rng:
        cell.value = 'Python'
 
# 마지막 행 구하기
print('입력 후: ' + str(ws.max_column))
 
# 입력 된 열 구하기
for cell in ws['1:1'].__iter__():
    print(cell.value)
 
# 저장
wb.save(fileName)

8. 테두리

 
from openpyxl.styles import Border, Side
from openpyxl import Workbook, styles
 
# 파일명
 
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 워크북 활성화
ws = wb.active
 
# B2 입력
ws['B2'] = 'Hello'
# 왼쪽 테두리
ws['B2'].border = Border(left=Side(style='thin'))
# B3 입력
ws['B4'] = 'Excel'
# 왼쪽 테두리
ws['B4'].border = Border(Side('thin'))
 
# D2 입력
ws['D2'] = 'Hello'
# 오른쪽 테두리
ws['D2'].border = Border(right=Side(style='thin'))
# D4 입력
ws['D4'] = 'Excel'
# 오른쪽 테두리
ws['D4'].border = Border(None, Side('thin'))
 
# F2 입력
ws['F2'] = 'python'
# 모든 테두리
ws['F2'].border = Border(left=Side(style='thin'),right=Side(style='thin'),top=Side(style='thin'),bottom=Side(style='thin'))
# F4 입력
ws['F4'] = 'python'
# 모든 테두리
ws['F4'].border = Border(Side('thin'),Side('thin'),Side('thin'),Side('thin'))
 
# 사용자 스타일
THIN_BORDER = Border(Side('thin'),Side('thin'),Side('thin'),Side('thin'))
# H2 입력
ws['H2'] = 'Style'
# 모든 테두리
ws['H2'].border = THIN_BORDER
# H4 입력
ws['H4'] = 'Style'
# 모든 테두리
ws['H4'].border = THIN_BORDER
 
# 범위 테두리 설정
for rng in ws['J2:K10']:
    for cell in rng:
        cell.value = 'All' # [J2:K10] = 'All'
        cell.border = THIN_BORDER # [J2:K10] 모든테두리 설정
 
# 저장
wb.save(fileName)

9. 시트

 
from openpyxl.styles import Border, Side
from openpyxl import Workbook, styles
 
# 파일명
fileName = 'TEST.xlsx'
 
# 워크북 생성
wb = Workbook()
 
# 시트1 생성
ws_1 = wb.create_sheet()
 
# 시트2 생성
ws_2 = wb.create_sheet()

# 시트2 시트명 변경
ws_2.title = '시트2'
 
# 시트3 생성 (시트명 정의)
ws_3 = wb.create_sheet('시트3')
 
# 시트명 출력
for sheetName in wb.sheetnames:
    print(sheetName)
 
# 모든 워크시트 A1 입력
for wss in wb.worksheets:
    wss['A1'] = 'python'
 
# 특정 워크시트 A2 입력
ws = wb.get_sheet_by_name('시트3')
ws['A2'] = 'hello'
 
# 저장
wb.save(fileName)

10. Excel to Text

 
import openpyxl

def find_parks_not_in_us():
    # 엑셀파일(워크북) 열기
    wb = openpyxl.load_workbook('example.xlsx')
    
    # 워크시트 열기
    sheet = wb.get_sheet_by_name('Sheet1')
    
    # 결과를 저장할 리스트
    parklist = []
    
    # 파일을 로우 단위로 읽어 국가가 US가 아닌 로우를 파일로 쓴다.
    # 1. 파일을 읽을 범위를 결정
    # 2. 로우를 순회하면서 US가 아닌 로우를 리스트로 만든다.
    for row in sheet[2:sheet.max_row]:
        print(row)
        if row[5].value != 'US':
            parklist.append(row)
    wb.close()
    return parklist
    
def make_file(partlist):
    with open('parklist.txt', 'w', encoding='utf-8') as file:
        for item in parklist:
            part_str = make_parkstr(item)
            file.write(park_str + '\n')
            
def make_parkstr(t):
    result_str = ''
    
    for item in t:
        result_str += str(item.value) + '\t'
        
    return result_str
    
def main():
    parklist = find_parks_not_in_us()
    make_file(parklist)
    print('parklist.txt 파일이 생성되었습니다.')
    
if __name__ == '__main__':
    main()

2021.01.10

Python 가상환경 Batch 파일 실행


call conda activate [env_name] 
call cd [path] 
call python [file_name.py]

2021.01.13

Pandas DataFrame 그림파일로 변환


import dataframe_image as dfi

dfi.export(df, 'result.png')

2021.01.16

R


# 차함수
> x <- c(1,2,4,5,7,9,10)
> y <- c(1,2,3,4,5,8,10)
> z <- setdiff(x, y)
7 9
> z <- setdiff(y, x)
3 8
# 교집합
> z <- intersect(x, y)
1 2 4 5 10

2021.03.25

파이썬 배포를 위한 cython을 활용

다른 py에서 import해서 사용할 수 있도록 모듈화 하여 py 작성
확장자를 pyx로 변경
setup.py 생성


    from distutils.core import setup
    from Cython.Build import cythonize
    setup(ext_modules = cythonize('pyx파일명'))

cmd창에서 python setup.py build_ext --inplace
실행용 py 생성하여 import 파일명
<GUI 버젼일 경우 예시>


    import PowerControl as pc
    app = pc.QApplication(pc.sys.argv)
    myWindow = pc.MyWindow()
    app.exec()

배포 시 실행용 py, pyd(pyd파일명에 py37~~ 삭제 가능), ui파일(GUI버젼일 경우)

Name		Name	Last commit message	Last commit date
Latest commit History 90 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
_config.yml		_config.yml

License

kamzzang/TIL

Folders and files

Latest commit

History

Repository files navigation

Today I learned

2020.02.09

Git basic command

Change git editor

Reset

Display log(branch)

Correct coCcommit massage

2020.03.12

Git remote

2020.03.20

pyc compile(pyc_compile.py)

bat file(2 python versions)

2020.03.23

DataFrame Error Fix

2020.03.27

동적 변수 생성

2020.03.28

json 파일 생성

json 파일 open

환경변수 불러오기

2020.04.02

Numpy Zero-like

2020.04.12

Folium Marker icon ref.

2020.04.15

AWS SSH 연결

AWS server 구동

중지

추가

key파일없는 PC에서 원격 연결(homepage)

2020.04.16

KAKAO MAPS API

2020.05.07

install python anaconda 32bit envs

To activate envs.

To deactivate an active envs.

2020.05.18

pandas string

2020.05.19

OS Module

2020.05.21

datetime

2020.06.02

Class member variable

변수 존재 확인

2020.06.08

AWS EC2 ubuntu 유저 생성(pem 파일없이 패스워드 사용 접속)

2020.06.23

Pandas DataFrame 중복제거

Pandas DataFrame index 초기화

2020.06.27

리스트형 내에서의 임의의 외부 숫자 위치 확인

2020.06.29

파일 실행

2020.07.13

구글스프레드시트 주식 데이터 받기

GOOGLEFINANCE

2020.07.14

SQLite3 데이터 중복 제거

2020.07.15

SQLite3 DataFrame 저장

2020.07.16

SQLite3 query

2020.07.20

크롤링 requests SSLError 해결

2020.08.08

Pandas Sorting

Pandas Rank

2020.09.15

Pandas String to DateTime

2020.09.25

SQLite3 query

2020.09.30

R

Packages