-
Notifications
You must be signed in to change notification settings - Fork 371
/
solution_02_13.py
30 lines (26 loc) · 1.25 KB
/
solution_02_13.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import spacy
from spacy.matcher import Matcher
nlp = spacy.load("es_core_news_sm")
doc = nlp(
"Cuando pac-man debutó en Tokio, en 1980, nadie podría haber predicho "
"que se convertiría en el videojuego más exitoso de todos los tiempos. "
"Hoy, 40 años después, aun sigue sorprendiendo. Su desarrolladora, "
"Bandai Namco, ha anunciado novedades en el marco del aniversario del "
"juego. La celebración del 40 aniversario de pac-Man en 2020 incluirá "
"el debut de una nueva canción temática, compuesta por el famoso artista "
"japonés de Techno Ken Ishii. Además de estas novedades, Bandai Namco "
"publicará nuevas versiones del videojuego. La primera será pac-man Live "
"Studio, en Twitch, en colaboración con Amazon Games."
)
# Crea los patrones
pattern1 = [{"LIKE_NUM": True}, {"POS": "NOUN"}]
pattern2 = [{"LOWER": "pac-man"}, {"IS_TITLE": True}]
# Inicializa el Matcher y añade los patrones
matcher = Matcher(nlp.vocab)
matcher.add("PATTERN1", [pattern1])
matcher.add("PATTERN2", [pattern2])
# Itera sobre los resultados
for match_id, start, end in matcher(doc):
# Imprime en pantalla el nombre en string del patrón
# y el texto del span encontrado
print(doc.vocab.strings[match_id], doc[start:end].text)