Information extraction from the web using a search engine Citation for published version (apa)



Yüklə 0,9 Mb.
Pdf görüntüsü
səhifə18/57
tarix09.02.2022
ölçüsü0,9 Mb.
#52298
1   ...   14   15   16   17   18   19   20   21   ...   57
s
occurs in one of the definitions for t, then is likely to be an
instance of c
s
. In Chapter 4 we will use this mechanism to evaluate a populated
ontology.
Data-Driven Approach
In Chapter 2 we argued that we opt for an approach without manual annotations.
Hence, in choosing a data-driven approach, we should opt for an unsupervised
learning mechanism to recognize instances in texts.
Using a set of instances, we head for an approach where we create a training
set of texts by automatic annotations. We illustrate the construction of a training
set with the following example. Suppose we have an ontology with two classes,
Year and Person. We assume both sets of instances to be non-empty. The relation
yob between the two classes is expressed by the given pattern [person] was born in
[year].
Now, we select one instance and pattern combination, say
was born in 1854 (cf.
Table 3.10). We can automatically annotate the search results for this query as
1854
is a known instance of the class
Year. In the search results, the queried instances
can be automatically labeled marked as members of the class. Other instances (e.g.
1875 in the first line of Table 3.10) are ignored as these instances are less likely to
reflect a year of birth.
When we select an instance from the other class, i.e.
Person, we are to scan the
search results for instances of
Year. Using the search results for the other query, we


3.2 Identifying Instances
47
Maria Paulina ”Mary” Wittrock
was born in
1854 and, in the year 1875, was
the
At one point, she claimed she
was born in
1854.
Secretary Weir
was born in
1854 in El Monte, California, and spent his child-
hood
(11.) Lucinda Crank
was born in
1854. 4. Mary Polly Crank was born in 1804
and died in 1883.
resident of Cherokee township,
was born in
1854 in Pennsylvania, where he
lived
Wilde, 1854-1900. Oscar Wilde
was born in
1854 and grew up in an intellec-
tually bustling Irish
of Wisconsin. Home Page. William Alexander Grimshaw
was born in
1854 in
New York.
4 iii. Thomas COLLINS
was born in
1854 in Michigan. 5 iv.
Edith A. Curry
was born in
1854 in Kentucky. She died on 15 Oct 1930 in
Georgia. M
Elizabeth Youngblood
was born in
1854-5. She married Post.
Oscar Wilde
was born in
1854 and grew up in an intellectually bustling Irish
household. His mother was a poet who wrote under the pen name Speranza
and who had a
Table 3.10. Example search results for the query
was born in 1854
. The instance
1854
is annotated.
can learn the structure and context of instances of this class. Hence, when querying
for example
Alan Turing was born in, the use of the search results (Table 3.11) is
twofold.
1. The search results are used to identify instances of the class
Year and relation
instances expressing the relation between Turing and his year of birth.
2. The training set to learn instances of
Person is expanded using the search
results for the said query.
In the training set, we only annotate the queried instance. Having labeled the
instances in the sentences in the training set, the task is to create training data for
a classifier. Hereto, each word, number and punctuation mark, called
token, is


48
in the town of Chatrapur,
Alan Turing was born in
a nursing home in Paddington,
London.
Alan Turing was born in
London, England, on June 23, 1912.
Alan Turing was born in
1912 and showed an early interest in the natural world. He
studied mathematics at Cambridge University and established himself as a
Alan Turing was born in
London, England, on June 23, 1912. Both his parents
Alan Turing was born in
1914 and
Alan Turing was born in
London, England in 1912.
Alan Turing was born in
Paddington London on 23 June 1912 and went on to study
Alan Turing was born in
London on June 23, 1912.
Ir J Psych Med March 2003;Vol 20 No 1: 28-31.
Alan Turing was born in
Paddington,
London on June 23, 1912. His family were middle-class and well-off.
Alan Turing was born in
London, England, on June 23, 1912.
Known as the founder of Computer Science,
Alan Turing was born in
1912 in Padding-
ton, London.
Alan Turing was born in
June of 1912 to Julius Mathison Turing, a member of the
Table 3.11. Example search results for the query
Alan Turing was born in
. The
goal is to identify the year of birth.
labeled in the sentences. We distinguish three classes:

Yüklə 0,9 Mb.

Dostları ilə paylaş:
1   ...   14   15   16   17   18   19   20   21   ...   57




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin