-
Notifications
You must be signed in to change notification settings - Fork 0
/
tool-web.qmd
673 lines (532 loc) · 23 KB
/
tool-web.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
---
editor:
markdown:
wrap: 72
---
```{r}
#| include: false
source("_common.R")
```
# 웹서비스 사용하기 {#r-webservice}
프로그램을 사용하여 HTTP상에서 문서를 가져와서 파싱하는 것이 익숙해지면,
다른 프로그램(즉, 브라우저에서 HTML로 보여지지 않는 것)에서 활용되도록
특별히 설계된 문서를 생성하는 것은 그다지 오래 걸리지 않는다.
웹상에서 데이터를 교환할 때 두 가지 형식이 많이 사용된다.
XML("eXtensible Markup Language")은 오랜 기간 사용되어 왔고
문서-형식(document-style) 데이터를 교환하는 데 가장 적합하다. 딕셔너리,
리스트 혹은 다른 내부 정보를 프로그램으로 서로 교환할 때,
JSON(JavaScript Object Notation, [www.json.org](www.json.org))을
사용한다. 두 가지 형식에 대해 모두 살펴볼 것이다.
## XML {#ws-xml}
XML(eXtensible Markup Language)은 HTML과 매우 유사하지만, XML이 HTML보다
좀 더 구조화되어 있다. 여기 XML 문서 샘플이 있다.
```{xml}
<person>
<name>Chuck</name>
<phone type="intl">
+1 734 303 4456
</phone>
<email hide="yes"/>
</person>
```
종종 XML 문서를 나무 구조(tree structure)로 생각하는 것이 도움이 된다.
최상단 `person` 태그가 있고, `phone` 같은 다른 태그는 부모 노드의
*자식(children)* 노드로 표현된다.
![XML 나무구조 도식화](images/xml-tree.png){#fig-web-xml
fig-align="center" width="450"}
## XML 파싱 {#ws-xml-parsing}
\index{xml2} \index{xml2!xml\_find\_first}
다음은 XML을 파싱하고 XML에서 데이터 요소를 추출하는 간단한
응용프로그램이다.
::: panel-tabset
### R
```{webr-r}
#| label: r-xml-parsing
library(xml2)
data <- '
<person>
<name>Chuck</name>
<phone type="intl">
+1 734 303 4456
</phone>
<email hide="yes"/>
</person>'
doc <- read_xml(data)
name <- xml_find_first(doc, ".//name") |> xml_text()
email_attr <- xml_find_first(doc, ".//email") |> xml_attr("hide")
message("Name:", name)
#> Name: Chuck
message("Attr:", email_attr)
#> Attr: yes
```
### 파이썬
```{pyodide-python}
#| label: py-xml-parsing
import xml.etree.ElementTree as ET
data = '''
<person>
<name>Chuck</name>
<phone type="intl">
+1 734 303 4456
</phone>
<email hide="yes"/>
</person>'''
tree = ET.fromstring(data)
print('Name:', tree.find('name').text)
print('Attr:', tree.find('email').get('hide'))
#> Name: Chuck
#> Attr: yes
```
:::
`xml2` 패키지 `read_xml()` 함수를 사용하여 XML 문자열 표현을 XML 노드
'나무(tree)'로 변환한다. XML이 나무 구조로 되었을 때, XML에서 데이터
일부분을 추출하기 위해서 호출하는 함수가 있다. `xml_find_first()` 함수는
XML 나무를 훑어서 XPath 표현을 사용하여 특정한 태그와 매칭되는
**노드(node)**를 검색한다. 각 노드는 텍스트, 속성(즉, hide 같은), 그리고
"자식(child)" 노드로 구성된다. 각 노드는 노드 나무의 최상단이 될 수
있다.
``` bash
Name: Chuck
Attr: yes
```
`xml2` 같은 XML 패키지를 사용하는 것은 장점이 있다. 상기 예제의 XML은
매우 간단하지만, 적합한 XML에 관해서 규칙이 많이 있고, XML 구문 규칙에
얽매이지 않고 `xml2`를 사용해서 XML에서 데이터를 추출할 수 있다.
## 노드 반복하기 {#ws-xml-nodes}
\index{xml2!xml\_find\_all}
종종 XML이 다중 노드를 가지고 있어서 모든 노드를 처리하는 루프를 작성할
필요가 있다. 다음 프로그램에서 모든 `user` 노드를 루프로 반복한다.
::: panel-tabset
### R
```{webr-r}
#| label: r-xml-nodes
library(xml2)
# XML 데이터 정의
xml_data <- '
<stuff>
<users>
<user x="2">
<id>001</id>
<name>Chuck</name>
</user>
<user x="7">
<id>009</id>
<name>Brent</name>
</user>
</users>
</stuff>'
# XML 데이터 파싱
parsed_xml <- read_xml(xml_data)
# 'user' 노드 찾기
users <- xml_find_all(parsed_xml, ".//user")
# 사용자 수 출력
message('User count:', length(users))
# 각 사용자의 이름, 아이디, 속성 출력
for (user in users) {
message('Name:', xml_text(xml_find_first(user, ".//name")))
message('Id:', xml_text(xml_find_first(user, ".//id")))
message('Attribute:', xml_attr(user, "x"))
}
```
### 파이썬
```{pyodide-python}
#| label: py-xml-nodes
import xml.etree.ElementTree as ET
input_xml = '''
<stuff>
<users>
<user x="2">
<id>001</id>
<name>Chuck</name>
</user>
<user x="7">
<id>009</id>
<name>Brent</name>
</user>
</users>
</stuff>'''
stuff = ET.fromstring(input_xml)
lst = stuff.findall('users/user')
print('User count:', len(lst))
for item in lst:
print('Name', item.find('name').text)
print('Id', item.find('id').text)
print('Attribute', item.get('x'))
#> User count: 2
#> Name Chuck
#> Id 001
#> Attribute 2
#> Name Brent
#> Id 009
#> Attribute 7
```
:::
`xml_find_all()` 함수는 R 리스트의 하위 나무를 가져온다. 리스트는 XML
나무에서 `user` 구조를 표현한다. 그리고 나서, `for` 루프를 작성해서 각
`user` 노드 값을 확인하고 `name`, `id` 텍스트 요소와 `user` 노드에서 `x`
속성도 가져와서 출력한다.
``` bash
User count: 2
Name: Chuck
Id: 001
Attribute: 2
Name: Brent
Id: 009
Attribute: 7
```
## JSON {#webservice-json}
\index{JSON} \index{JavaScript Object Notation}
JSON(JavaScript Object Notation) 형식은 자바스크립트 언어에서 사용되는
객체와 배열 형식에서 영감을 얻었다. 하지만 파이썬이 자바스크립트 이전에
개발되어서 딕셔너리와 리스트의 파이썬 구문이 JSON 구문에 영향을 주었다.
그래서 JSON 포맷이 거의 파이썬 리스트와 딕셔너리의 조합과 일치한다.
상기 간단한 XML에 대략 상응하는 JSON으로 작성한 것이 다음에 있다.
```{json}
{
"name" : "Chuck",
"phone" : {
"type" : "intl",
"number" : "+1 734 303 4456"
},
"email" : {
"hide" : "yes"
}
}
```
몇 가지 차이점에 주목하세요. 첫째로 XML에서는 "phone" 태그에 "intl" 같은
속성을 추가할 수 있다. JSON에서는 단지 키-값 페어(key-value pair)다.
또한 XML "person" 태그는 사라지고 외부 중괄호 세트로 대체되었다.
일반적으로 JSON 구조가 XML보다 간단하다. 왜냐하면, JSON이 XML보다 적은
역량을 보유하기 때문이다. 하지만 JSON이 딕셔너리와 리스트의 조합에
*직접* 매핑된다는 장점이 있다. 그리고, 거의 모든 프로그래밍 언어가
파이썬 딕셔너리와 리스트에 상응하는 것을 갖고 있어서, JSON이 협업하는 두
프로그램 사이에서 데이터를 교환하는 매우 자연스러운 형식이 된다.
XML에 비해서 상대적으로 단순하기 때문에, JSON이 응용프로그램 간 거의
모든 데이터를 교환하는 데 있어 빠르게 선택되고 있다.
## JSON 파싱하기 {#webservice-json-parsing}
딕셔너리(객체)와 리스트를 중첩함으로써 JSON을 생성한다. 이번 예제에서,
사용자 리스트를 표현하는데, 각 사용자가 키-값 페어(key-value pair, 즉,
딕셔너리)다. 그래서 리스트 딕셔너리가 있다.
다음 프로그램에서 내장된 **json** 라이브러리를 사용하여 JSON을 파싱하여
데이터를 읽어온다. 이것을 상응하는 XML 데이터, 코드와 비교해 보세요.
JSON은 조금 덜 정교해서 사전에 미리 리스트를 가져오고, 리스트가
사용자이고, 각 사용자가 키-값 페어 집합임을 알고 있어야 한다. JSON은 좀
더 간략(장점)하고 하지만 좀 더 덜 서술적(단점)이다.
::: panel-tabset
### R
```{webr-r}
#| label: r-jsonlite
library(jsonlite)
input <- '
[
{ "id" : "001",
"x" : "2",
"name" : "Chuck"
} ,
{ "id" : "009",
"x" : "7",
"name" : "Chuck"
}
]'
info <- fromJSON(input)
message('User count:', nrow(info))
for (i in seq_len(nrow(info))) {
item <- info[i, ]
message('Name:', item$name)
message('Id:', item$id)
message('Attribute:', item$x)
}
```
### 파이썬
```{pyodide-python}
#| label: py-jsonlite
import json
input = '''
[
{ "id" : "001",
"x" : "2",
"name" : "Chuck"
} ,
{ "id" : "009",
"x" : "7",
"name" : "Chuck"
}
]'''
info = json.loads(input)
print('User count:', len(info))
for item in info:
print('Name', item['name'])
print('Id', item['id'])
print('Attribute', item['x'])
```
:::
JSON과 XML에서 데이터를 추출하는 코드를 비교하면, `jsonlite` 패키지
`fromJSON()` 함수는 JSON 파일을 즉시 정형 데이터프레임으로 변환시킨다.
프로그램 출력은 정확하게 상기 XML 버전과 동일한 정보를 데이터프레임으로
표현하고 있어 후속 작업에 훨씬 유연하게 대응할 수 있다.
```{bash}
#| eval: false
User count: 2
Name Chuck
Id 001
Attribute 2
Name Brent
Id 009
Attribute 7
```
일반적으로 웹서비스에 대해서 XML에서 JSON으로 옮겨가는 산업 경향이
뚜렷하다. JSON이 프로그래밍 언어에서 이미 갖고 있는 네이티브 자료 구조와
좀 더 직접적이며 간단히 매핑되기 때문에, JSON을 사용할 때 파싱하고
데이터 추출하는 코드가 더욱 간단하고 직접적이다. 하지만 XML이 JSON보다
좀 더 자기 서술적이고 XML이 강점을 가지는 몇몇 응용프로그램 분야가 있다.
예를 들어, 대부분의 워드 프로세서는 JSON보다는 XML을 사용하여 내부적으로
문서를 저장한다.
## API {#ws-api}
\index{API} \index{응용 프로그램 인터페이스}
\index{Application Program Interface}
이제 HTTP를 사용하여 응용프로그램 간에 데이터를 교환할 수 있게 되었다.
또한, XML 혹은 JSON을 사용하여 응용프로그램 간에도 복잡한 데이터를
주고받을 수 있는 방법을 습득했다.
다음 단계는 상기 학습한 기법을 사용하여 응용프로그램 간에
"계약(contract)"을 정의하고 문서화한다. 응용프로그램-대-응용프로그램
계약에 대한 일반적 명칭은 API **응용 프로그램 인터페이스(Application
Program Interface)**다. API를 사용할 때, 일반적으로 하나의 프로그램이
다른 응용 프로그램에서 사용할 수 있는 가능한 서비스 집합을 생성한다.
또한, 다른 프로그램이 서비스에 접근하여 사용할 때 지켜야 하는 API (즉,
"규칙")도 게시한다.
다른 프로그램에서 제공되는 서비스에 접근을 포함하여 프로그램 기능을
개발할 때, 이러한 개발법을 SOA, **Service-Oriented Architecture(서비스
지향 아키텍처)**라고 부른다. SOA 개발 방식은 전반적인 응용 프로그램이
다른 응용 프로그램 서비스를 사용하는 것이다. 반대로, SOA가 아닌 개발
방식은 응용 프로그램이 하나의 독립된 응용 프로그램으로 구현에 필요한
모든 코드를 담고 있다.
웹을 사용할 때 SOA 사례를 많이 찾아볼 수 있다. 웹사이트 하나를 방문해서
비행기표, 호텔, 자동차를 단일 사이트에서 예약 완료한다. 호텔 관련
데이터는 물론 항공사 컴퓨터에 저장되어 있지 않다. 대신에 항공사 컴퓨터는
호텔 컴퓨터와 계약을 맺어 호텔 데이터를 가져와서 사용자에게 보여준다.
항공사 사이트를 통해서 사용자가 호텔 예약을 동의할 경우, 항공사
사이트에서 호텔 시스템의 또 다른 웹서비스를 통해서 실제 예약을 한다.
전체 거래(transaction)를 완료하고 카드 결제를 진행할 때, 다른 컴퓨터가
프로세스에 관여하여 처리한다.
![서비스 지향 아키텍처](images/soa.png){#fig-web-soa fig-align="center"
width="400"}
서비스 지향 아키텍처는 많은 장점이 있다. (1) 항상 단 하나의 데이터만
유지 관리한다. 이중으로 중복 예약을 원치 않는 호텔 같은 경우에 매우
중요하다. (2) 데이터 소유자가 데이터 사용에 대한 규칙을 정한다. 이러한
장점으로, SOA 시스템은 좋은 성능과 사용자 요구를 모두 만족하기 위해서
신중하게 설계되어야 한다.
응용프로그램이 웹상에 이용 가능한 API로 서비스 집합을 만들 때,
**웹서비스(web services)**라고 부른다.
## 지오코딩 웹서비스 {#google-geocoding}
\index{구글} \index{지오코딩} \index{웹 서비스} \index{API}
\index{카카오} \index{지도 API}
구글이 자체적으로 구축한 대용량 지리 정보 데이터베이스를 누구나 이용할
수 있게 하는 훌륭한 웹서비스가 있다. "Ann Arbor, MI" 같은 지리 검색
문자열을 지오코딩 API에 넣으면, 검색 문자열이 의미하는 지도상에 위치와
근처 주요 지형지물 정보를 나름 최선을 다해서 예측 제공한다.
지오코딩 서비스는 무료지만 사용량이 제한되어 있어서, 상업적
응용프로그램에 API를 무제한 사용할 수는 없다. 하지만, 최종 사용자가 자유
형식 입력 박스에 위치 정보를 입력하는 설문 데이터가 있다면, 구글 API를
사용하여 데이터를 깔끔하게 정리하는 데는 유용하다.
구글 지오코딩 API 같은 무료 API를 사용할 때, 자원 사용에 대한 지침을
준수해야 한다. 너무나 많은 사람이 서비스를 남용하게 되면, 구글은 무료
서비스를 중단하거나, 상당 부분 줄일 수 있다.
> When you are using a free API like Google's geocoding API, you need to
> be respectful in your use of these resources. If too many people abuse
> the service, Google might drop or significantly curtail its free
> service.
서비스에 대해서 자세한 사항을 온라인 문서를 정독할 수 있지만, 무척
간단해서 브라우저에 다음 URL을 입력해서 테스트까지 할 수 있다.
[http://maps.googleapis.com/maps/api/geocode/json?sensor=false
&address=Ann+Arbor%2C+MI](http://maps.googleapis.com/maps/api/geocode/json?sensor=false%20&address=Ann+Arbor%2C+MI)
웹 브라우저에 붙여넣기 전에, URL만 뽑아냈고 URL에서 모든 공백을
제거했는지 확인한다. 그리고, 브라우저에 붙여 넣기한다.
다음은 간단한 응용 프로그램이다. 사용자가 검색 문자열을 입력하고 구글
지오코딩 API를 호출하여 반환된 JSON에서 정보를 추출한다. 구글 지리정보
API는 상용으로 전환되었기에 다음카카오 지도 API를 대체하여 동일한 개발
작업을 수행한다.
::: panel-tabset
### R
```{webr-r}
#| label: r-daum-kakao-code
library(httr)
library(jsonlite)
# usethis::edit_r_environ()
# 주소를 지정합니다.
kpmg_addr <- '서울특별시 강남구 역삼동 737'
# HTTP 요청을 실행합니다.
kpmg_res <- GET(url = 'https://dapi.kakao.com/v2/local/search/address.json',
query = list(query = kpmg_addr),
add_headers(Authorization = paste0("KakaoAK ", Sys.getenv("KAKAO_MAP_API_KEY"))))
# KPMG 지리정보 데이터프레임
kpmg_list <- kpmg_res |>
content(as = 'text') |>
fromJSON()
## 도로명주소
kpmg_list$documents$road_address |>
select(주소 = address_name, 경도 = x, 위도 = y)
#> 주소 경도 위도
#> 1 서울 강남구 테헤란로 152 127.036508620542 37.5000242405515
```
### 파이썬
```{pyodide-python}
#| label: py-daum-kakao-code
import os
import requests
from dotenv import load_dotenv
import json
# Load environment variables from a .env file
load_dotenv()
# Define the address
kpmg_addr = '서울특별시 강남구 역삼동 737'
# Define the request headers with the API key
headers = {
'Authorization': f'KakaoAK {os.getenv("KAKAO_MAP_API_KEY")}'
}
# Execute the HTTP request
response = requests.get(
'https://dapi.kakao.com/v2/local/search/address.json',
headers=headers,
params={'query': kpmg_addr}
)
# Parse the JSON response
kpmg_data = response.json()
# Extract and print the road address information
for document in kpmg_data.get('documents', []):
road_address = document.get('road_address', {})
print('주소:', road_address.get('address_name'))
print('경도:', road_address.get('x'))
print('위도:', road_address.get('y'))
#> 주소: 서울 강남구 테헤란로 152
#> 경도: 127.036508620542
#> 위도: 37.5000242405515
```
:::
```{bash}
#| eval: false
주소 경도 위도
1 서울 강남구 테헤란로 152 127.036508620542 37.5000242405515
```
프로그램이 사용자로부터 검색 문자열을 받는다. 적절히 인코딩된 매개변수로
검색 문자열을 변환하여 URL을 만든다. 그리고 나서 **httr** 패키지를
사용하여 카카오 지오코딩 API에서 텍스트를 가져온다. 고정된 웹페이지와
달리, 반환되는 데이터는 전송한 매개변수와 카카오 서버에 저장된 지리정보
데이터에 따라 달라진다.
JSON 데이터를 가져오면, **jsonlite** 패키지로 파싱하고 전송받은 데이터가
올바른지 확인하는 몇 가지 절차를 거친 후에 찾고자 하는 정보를 추출한다.
`Rscript` 프로그램 실행을 위해서 사용자 입력과 API 키 외부 유출 방지를
위한 조치를 취한 후에 일반화를 위해 코드를 일부 수정한다.
::: panel-tabset
### R
```{webr-r}
#| label: r-daum-kakao-api-input
library(httr)
library(jsonlite)
# api_address.R
cat("주소를 입력하세요 - ")
address <- readLines(file("stdin", encoding = "utf-8"), 1)
# address <- "서울특별시 강남구 역삼동 737"
# HTTP 요청을 실행합니다.
address_res <-
GET(url = 'https://dapi.kakao.com/v2/local/search/address.json',
query = list(query = address),
add_headers(Authorization = paste0("KakaoAK ",
Sys.getenv("KAKAO_MAP_API_KEY"))) )
# 지리정보 데이터프레임 변환
address_list <- address_res |>
content(as = 'text') |>
fromJSON()
## 도로명주소
address_list$documents$road_address |>
select(주소 = address_name, 경도 = x, 위도=y)
```
### 파이썬
```{pyodide-python}
#| label: py-daum-kakao-api-input
import requests
import os
from dotenv import load_dotenv
import json
load_dotenv()
api_key = os.getenv('KAKAO_MAP_API_KEY')
url = 'https://dapi.kakao.com/v2/local/search/address.json'
while True:
address = input('주소 입력: ')
if len(address) < 1:
break
headers = {
'Authorization': f'KakaoAK {api_key}'
}
response = requests.get(url,
headers=headers,
params={'query': address})
if response.status_code == 200:
js = response.json()
# print(json.dumps(js, indent=4))
else:
print("Failed to retrieve data:", response.status_code)
lat = js["documents"][0]["address"]["x"]
lng = js["documents"][0]["address"]["y"]
print('lat', lat, 'lng', lng)
#> 주소 입력: 서울특별시 강남구 역삼동 737
#> lat 127.036628730251 lng 37.4998101243238
```
:::
프로그램 출력결과는 다음과 같다.
``` bash
$ Rscript code/api_address.R
주소를 입력하세요 - '서울특별시 강남구 역삼동 737'
주소 경도 위도
1 서울 강남구 테헤란로 152 127.036508620542 37.5000242405515
```
다음카카오 지도 API 외 다른 지오코딩 관련 자세한 사항은 [공간통계를 위한
데이터 사이언스 - 지리정보 API - 주소와
위도경도](https://statkclee.github.io/spatial/geo-info-lonlat.html)
웹사이트를 참조한다.
## 보안과 API 사용 {#ws-security}
\index{OAuth} \index{API!키}
상용 업체 API를 사용하기 위해서는 일종의 "API 키(API key)"가 일반적으로
필요하다. 서비스 제공자 입장에서 누가 서비스를 사용하고 있으며 각
사용자가 얼마나 사용하고 있는지를 알고자 한다. 상용 API 제공 업체는
서비스에 대한 무료 사용자와 유료 사용자에 대한 구분을 두고 있다. 특정
기간 동안 한 개인 사용자가 사용할 수 있는 요청 수에 대해 제한을 두는
정책을 두고 있다.
때때로 API 키를 얻게 되면, API를 호출할 때 POST 데이터의 일부로
포함하거나 URL의 매개변수로 키를 포함시킨다.
또 다른 경우에는 업체가 서비스 요청에 대한 보증을 강화해서 공유 키와
비밀번호를 암호화된 메시지 형식으로 보내도록 요구한다. 인터넷을 통해서
서비스 요청을 암호화하는 일반적인 기술을 **OAuth**라고 한다.
<http://www.oauth.net> 사이트에서 OAuth 프로토콜에 대해 더 많은 정보를
만날 수 있다.
트위터(현 x.com) API가 점차적으로 가치 있게 됨에 따라 트위터가 공개된
API에서 API를 매번 호출할 때마다 OAuth 인증을 거치도록 API를 바꾸었다.
다행스럽게도 편리한 OAuth 라이브러리가 많이 있다.
그래서 명세서를 읽고 아무것도 없는 상태에서 OAuth 구현하는 것을 피할 수
있게 되었다. 이용 가능한 라이브러리는 복잡성도 다양한 만큼 기능적으로도
다양하다. OAuth 웹사이트에서 다양한 OAuth 라이브러리 정보를 확인할 수
있다.
OAuth 보안 요구사항을 충족하기 위해 추가된 다양한 매개변수 의미를 좀 더
자세히 알고자 한다면, OAuth 명세서를 읽어보기 바란다.
이와 같은 보안 API 키는 누가 트위터 API를 사용하고 어느 정도 수준으로
트위터를 사용하는지에 대해서 트위터가 확고한 신뢰를 갖게 한다. 사용량에
한계를 두고 서비스를 제공하는 방식은 단순히 개인적인 목적으로 데이터
검색을 할 수는 있지만, 하루에 수백만 API 호출로 데이터를 추출하여 제품을
개발하지 못하게 제한하는 기능도 동시에 한다.
## 용어 정의 {#ws-term}
- **API**: 응용 프로그램 인터페이스(Application Program Interface) -
두 응용 프로그램 컴포넌트 간에 상호작용하는 패턴을 정의하는 응용
프로그램 간의 계약. \index{API}
- **ElementTree**: XML 데이터를 파싱하는 데 사용되는 파이썬 내장
라이브러리. \index{ElementTree}
- **xml2**: XML 데이터를 파싱하는 데 사용되는 R 내장 라이브러리.
\index{xml2}
- **JSON**: JavaScript Object Notation - 자바스크립트 객체(JavaScript
Objects) 구문을 기반으로 구조화된 데이터 마크업(markup)을 허용하는
형식. \index{JSON}
- **REST**: REpresentational State Transfer - HTTP 프로토콜을 사용하여
응용 프로그램 내부에 자원에 접근을 제공하는 일종의 웹서비스 스타일.
\index{REST}
- **SOA**: 서비스 지향 아키텍처(Service Oriented Architecture) - 응용
프로그램이 네트워크에 연결된 컴포넌트로 구성될 때. \index{SOA}
- **XML**: 확장 마크업 언어(eXtensible Markup Language) - 구조화된
데이터의 마크업을 허용하는 형식. \index{XML}