<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
<title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
On 04-05-11 18:55, Core TX wrote:
<blockquote
cite="mid:BANLkTikQ5Fw_Ebcb2h_ykLNWg_ih0xsWSg@mail.gmail.com"
type="cite">
<meta http-equiv="Context-Type" content="text/html; charset=UTF-8">
<a moz-do-not-send="true"
href="mailto:voornaam.achternaam@europarl.europa.eu">voornaam.achternaam@europarl.europa.eu</a><br>
<br>
<div>
<blockquote>
<div> > ( Behoud de namen, en maak [naam] @<a
moz-do-not-send="true"
href="http://lists.piratenpartij.nl">lists.piratenpartij.nl</a><br>
> Een speciale lijst die ik graag zou willen zien i.v.m
mijn werkzaamheden is een lijst met *alleen* de Nederlandse<br>
> Europarlementariers.<br>
<br>
</div>
Hier snap ik het niet meer. Je opmerking over mailman
suggereert dat je<br>
op zoek bent naar e-mail adressen en die staan nou net niet in
de PDFjes.<br>
</blockquote>
</div>
</blockquote>
<br>
Hoi Samir,<br>
ik heb een paar duizend personen uit die PDFjes geslurpt, maar ik
snap nog steeds<br>
niet wat je nou precies wil. De e-mailadressen van alle
europarlementariers? Slechts<br>
een fractie van de mensen in die PDFjes is europarlementarier, en er
zijn makkelijkere<br>
manieren om aan hun namen te komen...<br>
De kwaliteit van de data is niet echt super en mijn parser is nogal
grof dus er zal nog<br>
een hoop moeten worden bijgeschaafd voor de gegevens ook bruikbaar
zijn. Dusver<br>
was het een leuke oefening, maar nu wil ik eerst precies weten waar
ik mee bezig ben<br>
voor ik me een hoop extra werk op de hals haal.<br>
<br>
$groet<br>
-- <br>
Casper Gielen<br>
<br>
<br>
<br>
</body>
</html>