Ako 160 000 zachytených komunikácií viedlo k nášmu najnovšiemu príbehu NSA

Blogy

Minulý víkend ALES publikoval príbeh, ktorý som napísal s Julie Tate a Ashkanom Soltanim o sledovaní Národnou bezpečnostnou agentúrou, ktorý zasahuje do rozhovorov ľudí, ktorí nie sú zahraničnými cieľmi. Príbeh založený na 160 000 zachytených komunikáciách, ktoré som dostal od bývalého dodávateľa NSA Edwarda Snowdena, vyvolal množstvo otázok, námietok a myslím si, že aj nedorozumení.

Niektorí čitatelia a komentátori opísali tento príbeh ako prehnané vyhlásenie o samozrejmosti: že sledovanie jednej osoby zahŕňa obsah ľudí, ktorí sa s ňou rozprávajú. Iní povedali, že ALES, nie vláda, narušili súkromie nevinných, pretože sme zverejnili ich rozhovory a NSA nie. Podľa názoru niektorých kritikov sme prejavili neznalosť systémov NSA alebo sme sa vedome rozhodli skresliť spôsob, akým fungujú.

(Prepis: Otázky a odpovede s Bartonom Gellmanom)

Dohľad NBÚ je z právneho, technického a prevádzkového hľadiska komplexný predmet. Starostlivo sme navrhli príbeh a stojíme si za ním. Chcem rozbaliť niektoré z hlavných bodov a kontroverzií, posypať novým materiálom pre kontext. V tomto formáte môžem ponúknuť viac technických podrobností o súbore údajov, ktorý Snowden poskytol, a metódach, ktoré sme použili na ich analýzu. Budem sa venovať aj niektorým etickým problémom a problémom národnej bezpečnosti, ktorým sme čelili. Popri tom vysvetlím, prečo náš príbeh vlastne podcenil jeho zistenia, objasním špekulácie o špionáži prezidenta Obamu a overím fakty nedávneho tweetu CIA o stratených heslách.

Začnime podrobným pohľadom na náš náskok:

Bežní používatelia internetu, Američania aj Neameričania, výrazne prevyšujú počet legálne zameraných cudzincov v komunikácii zachytenej Národnou bezpečnostnou agentúrou z digitálnych sietí USA, podľa štvormesačného vyšetrovania ALES.

Predstavte si veľkú hromadu rozhovorov, ktoré zachytila ​​NSA. V ňom sú texty rozhovorov a e-mailov spolu s fotografiami a inými druhmi súborov, ktoré niekto poslal niekomu inému. Spočítali sme všetkých ľudí, ktorí sa podieľali na týchto komunikáciách (presnejšie povedané, počet jedinečných online účtov) a porovnali sme toto číslo s počtom, na ktorý sa NSA zameriavala.

Väčšina účtov, ktoré sme našli v hromade, neboli ciele NSA a z právneho hľadiska by sa tak nekvalifikovali. Niektorí komentátori povedali, že to nie je prekvapujúce a nevýrazné. k tomu sa ešte vrátim.

Ďalej naň dáme číslo:

Deväť z 10 držiteľov účtov nájdených vo veľkej schránke zachytených rozhovorov, ktoré bývalý dodávateľ NSA Edward Snowden v plnom rozsahu poskytol The Post, neboli zamýšľanými cieľmi sledovania, ale boli chytení do siete, ktorú agentúra vrhla na niekoho iného.

Toto číslo je v skutočnosti príliš nízke, ale bolo to jediné, čo sme mohli zmerať s akoukoľvek presnosťou. Rozbila to grafika od Todda Lindemana . Našli sme asi 11 400 unikátnych online účtov. Medzi nimi asi 1 200 označil NSA za cudzie ciele. Zvyšných 10 000 a viac bolo podobných digitálnym okoloidúcim. Niektorí z nich poznali ciele NSA a rozprávali sa s nimi. Iní sa dostali do hromady tým, že sa pripojili k chatovacej miestnosti bez ohľadu na predmet alebo použili online službu hosťovanú na serveri, ktorý cieľ používal na niečo úplne iné.

Nemali sme oficiálny zoznam cieľov NSA. Museli sme ich nájsť v hromade sami. Soltani, nezávislý výskumník , urobil na tom väčšinu ťažkej práce. Pretože informácie neboli usporiadané do riadkov a stĺpcov, ako by to mohlo byť v tabuľkovom procesore, Soltani napísal počítačový kód, aby extrahoval to, čo sme hľadali, z niečoho ako štvrť milióna strán neštruktúrovaného textu.

Na niektoré z našich otázok nebolo možné odpovedať pomocou údajov, ktoré sme mali. Z tohto dôvodu náš príbeh nehovoril to, čo mu niektorí komentátori pripísali.

Toto sú jemné rozdiely, ale sú dôležité, pretože sme hlásili len to, čo sme mohli spočítať. Nepovedali sme, že NSA zachytila ​​väčší počet konverzácií alebo väčší objem obsahu patriaceho okoloidúcim ako cieľom. Povedali sme, že v týchto rozhovoroch bolo viac účastníkov (unikátnych online účtov), ​​ktorí neboli cieľmi, ako účastníkov, ktorí boli.

Tiež sme nepovedali, že v hromade je viac Američanov ako zahraničných cieľov. Máme podozrenie, že návrh môže byť pravdivý, ale nedokázali sme ho spoľahlivo potvrdiť.

Tu, z tretieho odseku, sú niektoré z vecí, ktoré by sme mohli spočítať:

Takmer polovica sledovacích súborov, čo je prekvapivo vysoký podiel, obsahovala mená, e-mailové adresy alebo iné podrobnosti, ktoré NSA označila ako patriace občanom alebo obyvateľom USA. Analytici NSA zamaskovali alebo minimalizovali viac ako 65 000 takýchto odkazov, aby ochránili súkromie Američanov, ale The Post našiel takmer 900 ďalších e-mailových adries, ktoré boli v súboroch odmaskované a ktoré by mohli byť silne spojené s občanmi USA alebo obyvateľmi USA.

Sú to tri samostatné a zmysluplné merania.

1. Američania – rozprávajúci sa, s ktorými sa hovorilo alebo o ktorých sa hovorilo – boli identifikovateľní v takmer polovici súborov, ktoré obsahovali zachytené rozhovory. To bol výsledok, ktorý sme neočakávali od sledovania zameraného na cudzincov nachádzajúcich sa v zámorí.

investorov, ktorí kupujú všetky domy

2. NSA prehltla toľko obsahu, že špehovala 1 250 cudzincov, že musela zakryť 65 000 odkazov na občanov USA a držiteľov zelenej karty. Toto číslo nezahŕňa americké spoločnosti, ktoré sú tiež americkými osobami podľa zákona o dohľade.

3. Analytici NSA nechali značný počet e-mailových adries v USA nezamaskovaných. Výskumníci zo Soltani a ALES Julie Tate a Jennifer Jenkins prepojili približne 900 zo zachytených účtov s identitami USA. Ich zdroje čerpali zo štandardných internetových vyhľadávaní, registračných záznamov účtov, zmien poštových adries v USA, marketingových databáz produktov, súdnych podaní a registračných zoznamov voličov. Kvalita týchto údajov je nedokonalá, ale je pravdepodobné, že vo väčšine prípadov bude presná.

Od ozbrojených síl cez NSA až po ministerstvo financií, PostTV rozdeľuje 16 rôznych agentúr a organizácií, ktoré zhromažďujú spravodajské informácie pre vládu USA – a 17. úrad, ktorý na všetky dohliada. (Davin Coburn/ALES)„Mimoriadnych“ a „minimalizovaných“ Američanov

Podmienky a pravidlá minimalizácie sú nepriehľadné a často sa používajú na nesprávne nasmerovanie verejnej diskusie. NSA má zakázané zameriavať sa na amerických občanov, držiteľov zelenej karty alebo spoločnosti na sledovanie bez individuálneho príkazu sudcu. Ak sa neúmyselne zameria na Američanov – v domnení, že sú cudzinci, a potom zistí opak – NSA zvyčajne zahodí ich konverzácie.

To všetko je dobré pre súkromie, ale nemá to veľa spoločného so spôsobom, akým sú Američania v skutočnosti zachytávaní systémami NSA. Americké spravodajské služby bežne používajú metódy zberu proti cudzincom, ktorí predvídateľne – s istotou – prijímajú aj veľké objemy americkej komunikácie.

Tomu sa hovorí náhodný zber. NSA tieto rozhovory s USA nezavrhuje. Ukladá ich s necenzurovanými menami v úložisku s názvom PINWALE a ďalších centrálnych databázach. Žiadny zákon nezakazuje NSA hľadať v tomto obsahu americké mená a iné identifikátory, a tak to robí. CIA to robí tiež a FBI nedávno oznámila, že prehľadáva údaje tak bežne, že nemôže poskytnúť počet. Pravidlá minimalizácie kladú podmienky na tieto vyhľadávania a obmedzujú, ale nezakazujú, distribúciu amerických identít v správach iným agentúram.

Neexistuje spôsob, ako zabrániť náhodnému zberu, ale politické rozhodnutia rozhodujú o tom, koľko z toho sa stane a čo NSA a iné agentúry môžu robiť s jeho ovocím.

V málo povšimnutej pasáži svojej správy prezidentova kontrolná skupina pre spravodajské a komunikačné technológie koncom minulého roka ( Odporúčanie 12, s. 28 ), že náhodne získané informácie o Američanoch by mali byť po odhalení vyčistené, pokiaľ neposkytujú cenné zahraničné spravodajské informácie alebo nevarujú ostatných pred vážnou ujmou. Väčšina z toho, čo NSA teraz uchováva, by sa pravdepodobne musela podľa tohto štandardu zlikvidovať. Prezident a jeho zamestnanci ho odložili bez verejného komentára.

Doteraz nebolo možné diskutovať o náhodnom zbere konkrétne. Nevedeli sme, koľko z toho sa stalo, ani povahu zhromaždeného súkromného obsahu. NSA neodpovedá na žiadne verejné otázky o týchto veciach. Kancelária riaditeľa národnej spravodajskej služby tvrdí, že nie je schopná odhadnúť ani to, koľko Američanov sa to týka. A žiadny vonkajší strážny pes – vrátane Kongresu, súdov, Rady pre dohľad nad súkromím a občianskymi slobodami alebo Revíznej skupiny pre spravodajské a komunikačné technológie – nemal prístup k dostatočnému množstvu zachyteného obsahu, aby to mohol posúdiť sám.

„Keď predpokladáš. . . '

Niektorí veteráni spravodajských služieb tento týždeň tvrdili, že náš príbeh propagoval neprekvapivé fakty. Bývalý generálny poradca NSA Stewart Baker napísal (na webovej stránke The Post), že sledovanie cieľa zjavne získava komunikáciu iných ľudí. (Výskumníci sociálnych sietí všade: Dobre, počítačový vedec Robert Olson tweetoval .)

Ak je to všetko, čo The Post povedal podľa Bakera:

. . . inherentná zaujatosť opatrenia je taká, že si vyžaduje uznanie. (Koniec koncov, umožňuje vám povedať, že „polovica všetkých majiteľov účtov v databáze nebola cieľom“, ak agentúra uchováva len jednu správu odoslanú cieľu.) Toto by mal rozpoznať každý napoly vnímavý redaktor.

Ako som už uviedol vyššie, zhodli sme sa, že náhodný zber v abstraktnej rovine nie je novinkou. V hornej časti nášho príbehu sme povedali, že je to nevyhnutné v mnohých formách sledovania.

Rozsah tejto zbierky a dôverné tajomstvá, ktoré odhaľuje, nemusia prekvapiť spravodajských znalcov, ktorí chápu vedľajšie účinky sledovania a dotieravosť považujú za samozrejmosť. Je to však prekvapujúce – a na základe reakcií čitateľov znepokojujúce – pre mnohých ľudí, ktorí sa spoliehali na verejné ubezpečenia, že NSA sa prísne zameriava na zahraničné ciele a nemôže čítať americké e-maily bez povolenia.

Tu je spôsob, akým sme túto otázku zostavili:

Záznamy o sledovaní poukazujú na politickú dilemu, ktorá bola na verejnosti zverejnená len abstraktne. V zachytených správach sú objavy značnej spravodajskej hodnoty – a vedľajšie poškodenie súkromia v rozsahu, ktorý Obamova administratíva nebola ochotná riešiť.

Marc Ambinder, novinár, ktorý napísal veľa o sledovaní, ponúkol podrobnejšiu kritiku. Zaslúži si o niečo dlhšiu odpoveď, pretože bola široko citovaná. Ambinder založil svoj záver, že náš príbeh bol krach, na nesprávnych predpokladoch o našom súbore údajov a chybných popisoch systémov, ktoré NSA používa na zachytenie a spracovanie komunikácie.

Podľa oddielu 702 novelizovaného zákona o dohľade nad cudzím spravodajstvom, píše Ambinder, domáce operácie NSA začínajú súdne certifikovanou triedou cieľov – ako napríklad „ruskí vládni úradníci žijúci v Utahu.“ V skutočnosti sú cieľové triedy certifikované súdom FISA oveľa širšie. (Rusko ako celok je jednou zo 193 certifikovaných krajín záujmu) a súd nie je informovaný o konkrétnych cieľoch, ktoré NSA vyberá z certifikovanej triedy. To dáva agentúre oveľa väčšiu voľnosť pri sledovaní, ako navrhuje Ambinder.

Ďalej, píše Ambinder, NSA sa pokúša automaticky eliminovať [ako je to možné] e-maily a chaty cieľových osôb s ľuďmi v Spojených štátoch. To je nesprávne. Existujú systémy, ktoré sa pokúšajú poraziť alebo odfiltrovať konverzácie, ktoré sú výlučne domáce alebo výlučne medzi Američanmi. NSA však nemá žiadnu zákonnú povinnosť a v praxi sa nepokúša odfiltrovať občanov alebo obyvateľov USA, ktorí komunikujú so zahraničným cieľom.

Tieto dve chyby privádzajú Ambindera k jeho hlavnému argumentu, ktorým je, že vysoký podiel náhodného zberu a odhalené identity USA, ktoré sme našli, vyplývajú z technických limitov automatizovaného systému minimalizácie. Ale to nie je problém, píše, pretože chyby sa neskôr v procese vyliečia ručne. Od analytikov NSA sa vyžaduje, aby minimalizovali každú komunikáciu s americkou osobou, ktorú vidia, píše, a náš príbeh bol založený na zachytenom obsahu, ktorý analytici ešte neskúmali.

Na komunikáciu sa jednoducho nehľadelo. Žiadna ľudská bytosť to nevidela. Reportéri The Post sa pozreli na každý jeden riadok 160 000 zachytení. Analytici NSA to nerobia / nemôžu to urobiť, pretože systém SIGINT by na sekundu nefungoval, keby tak urobili.

Aj to je nesprávne. Všetko vo vzorke, ktorú sme analyzovali, vyhodnotili analytici NSA na Havaji, stiahli z centrálnych úložísk agentúry a ručne minimalizovali po automatizovanom úsilí o vylúčenie identít USA. Podrobnejšie popisujem údaje na konci tohto príspevku.

Ak by naša vzorka nebola hodnotená, oveľa viac ako 90 percent ľudí v nej by boli necieľové. Keby to nebolo minimalizované, našli by sme oveľa viac Američanov, ako sme sami identifikovali.

Prečo boli naše zistenia podhodnotené

V údajoch, ktoré sme uviedli, sme zahrnuli každý odmaskovaný online účet. Nezahrnuli sme minimalizované účty, pretože sme nemali ako zistiť, koľko z nich je jedinečných.

Mohli by sme napríklad napočítať 2 721 výskytov výrazu minimalizovaná osoba v USA, 5 060 výskytov minimalizovaného používateľského mena v USA a 57 331 výskytov minimalizovanej adresy IP v USA. (Existuje niečo vyše 1 000 dodatočných kategórií minimalizovaného obsahu.) Teoreticky však nemôžeme vylúčiť, že všetky tieto výrazy zodpovedajú jedinej osobe – postave podobnej Zeligovi, ktorej konverzácie nejakým spôsobom obsiahli vesmír 11 000 účtov. V skutočnosti je pravdepodobné, že maskované identity USA sa počítajú na stovky alebo tisíce.

Žiadne z nich sme nezahrnuli do našich štatistík, pretože sme sa rozhodli nepripočítať číslo, ktoré sme nevedeli spočítať. Spomedzi účtov, ktoré sme mohli s istotou identifikovať, 900 patrilo Američanom a 1 250 zahraničným cieľom. Ak je iba 400 z desiatok tisíc maskovaných amerických identít jedinečných, potom databáza obsahuje viac Američanov ako zákonných zahraničných cieľov.

„Minimalizovaný prezident USA vchádza do baru“

Veľa Zavrieť čitateľov nepochopený pasáž hlboko v našom príbehu, ktorá sa týkala prezidenta Obamu. Mysleli si, že to znamená, že NSA zachytila ​​jeho e-mail. To nie. (Špehovanie prezidenta je správou, na ktorú sa pravdepodobne môžete spoľahnúť, že The Post umiestni na prvé miesto.) Ak by som toto čítanie predvídal, nasledujúce odseky by som napísal inak:

V súboroch sa objavuje viac ako 1 000 rôznych minimalizačných výrazov, ktoré sa pokúšajú zamaskovať totožnosť možných, potenciálnych a pravdepodobných osôb v USA, spolu s menami amerických spoločností zaoberajúcich sa výrobou nápojov, univerzít, reťazcov rýchleho občerstvenia a hostiteľov webovej pošty.

Niektoré z nich hraničia s absurditou a používajú tituly, ktoré by sa mohli vzťahovať len na jedného muža. Minimalizovaný zvolený prezident USA sa v súboroch začína objavovať začiatkom roku 2009 a odkazy na súčasného minimalizovaného prezidenta USA sa v nasledujúcich štyroch rokoch objavujú 1 227-krát.

Žiadne z týchto rozhovorov neboli rozhovory, ktorých sa zúčastnil Obama. Starostlivo sme skontrolovali. Štatistiky sa namiesto toho týkajú rozhovorov, v ktorých niekto iný spomenul meno prezidenta. Nikto z nich sa nezaoberal internými informáciami.

V jednej zachytenej konverzácii niekto povie vtip, ktorý sa začína: [MINIMALIZOVANÝ US OSOBA] a [MINIMALIZOVANÝ US PREZIDENT] vojdú do baru. Pointa si nájde cestu ku genocíde. Nie je to priateľský vtip. Pri ďalšej výmene názorov si niekto robí srandu zo známeho tým, že jeho rada o ženách je ako rada o islame od [MINIMALIZOVANÉHO BÝVALÉHO PREZIDENTA USA].

Niektoré nedorozumenia sa liečia ťažko. Poznamenal som na Twitteri na nedeľu a pondelok že Obamove rozhovory neboli odpočúvané. Viacerí z tých, ktorí odpovedali, boli nie naklonený do veriť to.

Veľa ľudí sa od zverejnenia príbehu pýtalo, či sme našli rozhovory zachytené od iných volených predstaviteľov, sudcov, novinárov alebo mimovládnych organizácií. Neurobili sme. Súbory obsahujú minimalizované odkazy na jedného senátora, jedného člena Kongresu, troch sudcov, troch amerických vysielateľov a niekoľko mimovládnych organizácií. Vo všetkých týchto prípadoch tieto témy spomínali iní ľudia v rozhovoroch o verejných udalostiach.

Naša zmienka o Obamovi mala upozorniť na ďalšiu vec. Porovnali sme dôslednú starostlivosť NSA o minimalizáciu v mnohých kontextoch s politikami, ktoré umožňujú analytikovi spoliehať sa na pochybné dôkazy ako základ pre posúdenie cieľa ako nespôsobilého na ochranu súkromia. Našli sme veľa prípadov, v ktorých analytici vychádzali z odôvodneného presvedčenia o cudzosti na skutočnosti, že cieľ hovoril cudzím jazykom alebo sa prihlasoval z IP adresy, ktorá sa zdala byť v zámorí. Tieto kritériá by sa vzťahovali na desiatky miliónov Američanov.

Technická podpora z Langley

CIA si minulý mesiac otvorila účet na Twitteri a použila drzý humor, aby si v krátkom čase získala veľké množstvo fanúšikov. V pondelok účet odoslaný toto oznámenie : Nie, nepoznáme vaše heslo, takže vám ho nemôžeme poslať. Stalo sa virálnym, s viac ako 12 000 retweetmi.

Ako sa stáva, súbory NSA, ktoré sme skúmali, obsahovali 1 152 minimalizovaných hesiel v USA, čo znamená heslá k americkým e-mailovým a chatovým účtom zachyteným z dátových odkazov v USA. Nečakajte technickú podporu od Langley, ale CIA má prístup k tejto surovej prevádzke.

„Nevinný“ v. „intímny“

Kritika nášho príbehu zo strany Stewarta Bakera urobila druhý bod, ktorý som vyššie nespomenul:

Príbeh je postavený na implicitnom tvrdení, že 90 % údajov o zachytení NSA je o nevinných ľuďoch. Štatistika je podľa mňa falošná.

To nie je to, čo príbeh povedal alebo čo to znamenalo. Nesnažili sme sa merať vinu alebo cnosť. Pre veľké objemy zachyteného obsahu je rozhodujúcou kvalitou intimita, nie nevinnosť.

Baker spôsobil, že jeho vlastná schránka znie dosť nudne, plná rutinných záležitostí a jednorazových správ, ktoré zvládnem krátkou odpoveďou (alebo ignorovaním správy). Ako sa stáva, e-maily netvoria väčšinu toho, čo NSA zachytí. Oveľa viac obsahu pochádza zo živého chatu, média pre mladých ľudí, ktoré je plné záujmov mladých ľudí.

Medzi veľkou väčšinou ľudí, ktorí nie sú cieľmi NSA, sú mnohé konverzácie v našej vzorke mimoriadne súkromné. Často sú veľmi vzdialené od publikovateľnosti, bez úprav.

On: A čo ty [sloveso, privlastňovacie prídavné meno, podstatné meno]

Ona: Ja [sloveso] ak ty [iné sloveso].

On: To sa dá zariadiť.

Ona: Naozaj potrebujem trest.

Ďalšia mladá žena, ktorá tiež nie je terčom, odpovie nápadníkovi, ktorý navrhne návštevu.

Ona: Nemysli si, že by to bolo fér od chlapa, ktorého vidím

On: Občas môžeš byť trochu nezbedný lol

Ona: Áno lol

Odtiaľ pokračuje rozhovor. Záleží žene alebo jej priateľovi na tom, že NSA zaznamenala jej posun k nevere, ak to ani jeden z nich nevie? (Je to austrálska občianka, ktorej identita by mala byť minimalizovaná s rovnakou starostlivosťou kvôli Američanovi, ale jej meno a fotografie sú demaskované.)

Záleží synovi na tom, že zdravotné záznamy jeho otca, alebo matke, že fotky z kúpania jej dieťaťa sú v obchodoch NSA?

Na začiatku diskusie o Snowdenovi predseda výboru pre spravodajstvo Snemovne reprezentantov Mike Rogers povedal na pojednávaní že skutočnosť, že sme nezaznamenali žiadne konkrétne sťažnosti, ktoré by tvrdili, že došlo k porušeniu ich súkromia, jasne naznačuje, že systém funguje.

Ale kto by sa sťažoval? spýtal sa svedok, profesor práva na americkej univerzite Stephen Vladeck.

Niekto, koho súkromie bolo narušené, odpovedal Rogers. Vaše súkromie nemôžete porušiť, ak neviete, že je porušené vaše súkromie.

Vladeck s týmto tvrdením ostro nesúhlasil. Pravidlá a postupy NSA podľa neho nemožno posudzovať bez objektívneho pohľadu na to, čo robí so svojou autoritou. To je diskusia, o ktorej mal náš príbeh informovať.

Hrniec, zoznámte sa s rýchlovarnou kanvicou

Pri zostavovaní nášho príbehu sme čelili paradoxu: Ako informujeme o škodách na súkromí bez toho, aby sme ich znásobili? Niektorých čitateľov znepokojila naša citácia súkromnej korešpondencie – a dokonca aj naše rozhodnutie prečítať si ju.

Ben Wittes, písanie na Lawfare , opisuje Snowdenov prenos obsahu NSA na mňa takto:

Dodávateľ poskytuje vyrovnávaciu pamäť 160 000 takýchto konverzácií – niektoré z nich sú veľmi zdĺhavé – tretej strane. Robí tak zjavne bez rozdielu a nenecháva nič iné, ako dôverovať, že príjemca materiál použije zodpovedne. Tretia strana potom pristúpi k publikovaniu pasáží. . . z korešpondencie súkromnej osoby, ktorá bola napísaná priateľovi o ich zdanlivom pomere – súkromnej osobe, ktorá nebola obvinená zo žiadneho protiprávneho konania. . . . Ak by daným dodávateľom bol ktokoľvek iný ako Edward Snowden, okamžite by sme toto odhalenie uznali za to, o čo ide: o masívne porušovanie občianskych slobôd presne toho typu, ktorému sa snažíme zabrániť, aby spravodajstvo podliehalo zásadám právneho štátu.

Poznáme tu dilemu, ale nemyslíme si, že odpoveď je jednoznačná. Bol tu dôležitý príbeh o sledovaní a súkromí. Neverili sme, že to môžeme povedať širokými narážkami na nešpecifikovaný osobný obsah v zachytených súboroch NSA. Tiež sme sa domnievali, že musíme pri ich citovaní prisúdiť význam súkromia a národnej bezpečnosti.

zvýšenie platov pre nevyhnutných pracovníkov

Wittes v súvislosti so ženou, ktorú sme citovali, píše, že hoci sme jej meno v príbehu jemne zamlčali, celý jej spoločenský svet bude vedieť, o koho ide. To je špekulácia. Žena mi hovorí niečo iné.

Od začiatku sme sa rozhodli, že nebudeme citovať zo žiadnej konverzácie bez súhlasu rečníka. Austrálčanka nám to poskytla za predpokladu, že sme vynechali jej meno a ďalšie podrobnosti, ktoré uviedla. Potom napísala, aby pochválila fantastický článok, a povedala, že jej zamestnávateľ a priatelia, okrem tých, ktorí ten príbeh už poznali, ho s ňou nespojili.

Ďakujem pekne, napísala. Oceňujem vašu snahu o zachovanie anonymity.

Odhliadnuc od jedného príkladu, Wittes podniká širší útok na Snowdena – v neobmedzenom uplatňovaní svojej neobmedzenej uváženia – zvolil Gellmana ako jedinú kontrolu a rovnováhu pri zverejňovaní osobných údajov – Gellmana, ktorý na rozdiel od NSA nemá žiadne zákonné normy, ktoré by dodržali. a žiadny dohľad zo strany Kongresu alebo súdov.

Je pravda, že až na pár výnimiek, ako je urážka na cti, vláda nestanovuje normy zverejňovania ani ma nenúti ich dodržiavať. To je celkom základná črta nášho ústavného systému. Spôsob, akým využívam túto slobodu, a rozhodnutia, ktoré The Post urobil pre tento príbeh, sú férovou hrou, ktorú môže posúdiť každý. Sme spokojní s našimi rozhodnutiami a spôsobom, akým sme ich urobili.

Požiadanie o súhlas pred cenovou ponukou nebolo našou jedinou a dokonca ani prvou úvahou. Už skôr sme si uvedomili, že už len to, že sme niekoho upozornili, že jej rozhovory boli zachytené, predstavujú riziká národnej bezpečnosti. Predtým, ako som jej zavolal, sme podali nezávislé správy, aby sme zistili, že bývalý priateľ Austrálčanky už nie je sledovaný a spravodajské služby USA ho už nepovažujú za hrozbu.

Aj keď sme vynechali mená, neváhali sme citovať zachytené rozhovory bez dôkladného premyslenia. Pozorovací cieľ môže rozpoznať charakteristický jazyk a podobne aj narážky na trápne tajomstvá, keď ich číta niekto blízky citovanej osobe.

Ako sa uvádza v našom príbehu, na Snowdenovej vzorke sme sami videli, že sledovanie podľa oddielu 702 prinieslo veľa cenných informácií. Ak by sme cieľu priamo alebo nepriamo povedali, že je pod mikroskopom NSA, ohrozili by sme to.

Keď sme hľadali príklady, ktoré by sme mohli citovať, začali sme kontrolou, či je sledovaný cieľ stále nažive a na slobode. Nezávislým hlásením sme identifikovali štyroch, ktorí boli vo väzbe. Priniesli sme tieto mená do NSA a CIA. Predstavitelia spravodajských služieb nám mimo záznamu poskytli konkrétne a presvedčivé dôvody, prečo by akákoľvek zmienka o dvoch z nich vykoľajila prebiehajúce operácie. Vynechali sme ich a v našom príbehu sme citovali ďalších dvoch – Muhammada Tahira Shahzada, výrobcu bômb so sídlom v Pakistane, a Umara Pateka, podozrivého z teroristického bombového útoku na indonézskom ostrove Bali v roku 2002.

Existujú riziká pre súkromie, ako poznamenali niektorí kritici, pri uchovávaní kópií zachytených súborov. Ak niekto ukradne archív, existujú porovnateľné riziká národnej bezpečnosti. Na základe odporúčaní popredných odborníkov sme prijali významné opatrenia, aby bol materiál čo najbezpečnejší pred cudzími ľuďmi. Žiadny zamestnanec ALES nemá nekontrolovaný prístup a len veľmi málo z nich má vôbec nejaký prístup. Zničenie súborov teraz by bolo najistejším spôsobom, ako zabezpečiť, aby neboli porušené. Vyvolalo by to právne otázky a zastavilo by to našu prácu na príbehu pokračujúceho globálneho dovozu. Z dlhodobého hľadiska sme sa nerozhodli.

Údaje a metódy

V súbore údajov, ktorý sme analyzovali, bolo 22 000 elektronických súborov, ktoré obsahovali obsah zachytený NSA v rokoch 2009 až 2012. Pochádzali z úložiska v regionálnom zariadení NSA Kunia na Havaji, ktoré zdieľala skupina analytikov, ktorí sa špecializujú na juhovýchod. Ázijské hrozby a ciele.

Túto havajskú databázu v podstate spravovali členovia skupiny. Čerpali z oveľa väčšieho skladu surového alebo nespracovaného obsahu hosteného v centrále NSA a importovali z neho výbery do šablón pre hodnotený materiál. Špeciálne kontroly prístupu chránili súbory na oboch miestach, pretože komunikácia bola získaná zo sieťových prepínačov a počítačových serverov v Spojených štátoch. Do roku 2008 si tento druh odberu vyžadoval individuálny zatykač od sudcu. Sekcia 702 FISA umožnila NSA samostatne vybrať desiatky tisíc cieľov podľa pravidiel a postupov, ktoré raz ročne preskúma súd.

Pretože našu vzorku ručne vybrali analytici pre havajskú databázu, obsahovalo oveľa menej irelevantného obsahu a náhodne zhromaždených správ z USA, ako by audítor našiel v centrálnej databáze PINWALE, z ktorej bola čerpaná.

Približne 16 000 dátových súborov obsahovalo text zachytených konverzácií. Zvyšok tvorili fotografie alebo dokumenty ako zdravotné záznamy, cestovné poukazy, prepisy zo školy a manželské zmluvy. Previedli sme akýkoľvek text vo vnútri obrazových súborov do strojovo čitateľnej podoby.

Niektoré súbory mali iba jeden e-mail alebo výmenu okamžitých správ. Iné obsahovali mnoho samostatných rozhovorov s mnohými účastníkmi. Iní mali dlhé, neprerušené prepisy rozhovorov, ktoré trvali niekoľko dní a stovky strán.

Aby Soltani analyzoval súbory, všetky ich vložil do databázy. Potom by sme mohli hľadať kvantifikovateľné informácie pomocou geekovských nástrojov, ako sú regulárne výrazy Unix a SQL, alebo štruktúrovaný dopytovací jazyk.

Chceli sme napríklad vedieť, koľko rôznych konverzácií bolo v súboroch. Soltani vyskúšal niekoľko metód na nájdenie hraníc v každom súbore dokumentu. Údaje označil za nečisté, s typografickými chybami a nezrovnalosťami v používaní formátovania a oficiálnych šablón. Soltani tieto chyby opravil pomocou viacerých kritérií vo svojich vyhľadávaniach, ako je napríklad prvý výskyt PINWALE identifikátora v hlavičke. Ich porovnaním sme sa dostali k zverejnenému číslu 160 000 konverzácií.

Väčšinu analýzy urobil Soltani, ale naučil ma klásť si vlastné otázky. E-mailové adresy, aby som uviedol veľmi jednoduchý príklad, sa vždy skladajú z prípustného rozsahu znakov pred a za znakom @, s bodkou v druhej polovici. Tento dopyt našiel 12 310 prístupov. Po vyčistení falošných poplachov a pridaní popisovačov chatu a Facebook ID sme dosiahli zverejnené číslo asi 11 400 jedinečných účtov.

Na identifikáciu toho, ktoré z týchto účtov boli cieľmi NSA, sme museli použiť zložitejšie metódy. Porovnali sme niekoľko prístupov, ktoré priniesli podobné, ale nie identické výsledky. Po preskúmaní, prečo sa líšia, sme usúdili, že počet jedinečných zápisov prípadov alebo CASN je najspoľahlivejší.

Zápis prípadu vyzerá takto: P2BSQC090008441. Pred rokom sme zverejnili šikovný slide na jeho dekódovanie.


Postavy SQC sú skratkou pre program PRISM, ktorý zhromažďuje obsah online účtov od deviatich veľkých internetových spoločností v USA. P2 identifikuje cieľ ako účet Yahoo, B hovorí, že ide o chatovací účet a zvyšok identifikuje rok začatia sledovania (2009) a jedinečné sériové číslo cieľa.

Kolekcia zo sieťových prepínačov, ktoré NSA nazýva Upstream, používa zápisy prípadu, ktoré začínajú XX.SQF. Tie sa tiež nazývajú zbierka FBI FISA, spravuje ju úrad a zdieľa s NSA. Upstream sa najčastejšie používa pre efemérnejšie formy chatu, ktoré nie je možné ľahko získať zo serverov internetových spoločností.

Celkový počet terčov v prepočte podľa CASN vyšiel na 1 257. Skontrolovali sme to číslo – dávalo to zmysel? — čítaním obsahu veľkej vzorky ich rozhovorov.

Julie Tate a Jennifer Jenkins vynaložili ohromnú prácu pri určovaní mien majiteľov účtov a skúmaní ich verejných záznamov. Takmer v každom prípade boli dôvody záujmu NSA zrejmé. Medzi viac ako 10 000 necielenými účtami komunikácia odrážala normálny rozsah ľudskej interakcie.

Kvôli zmenám, ktoré Kongres urobil v sekcii 702, Rada pre dohľad nad súkromím a občianskymi slobodami uviedla, že objem necielenej zbierky – a vedľajšieho obsahu v USA v rámci nej – exponenciálne vzrástol.

Správna rada sa rozdelila v otázke, či by vláda mala byť povinná získať príkaz na prehľadanie a využitie zachytených rozhovorov v USA. (Teraz nie je potrebný žiadny príkaz.) Prezidentova kontrolná skupina zašla ešte ďalej a odporučila, aby NSA vo väčšine prípadov zahodila obsah z USA.

Obamova administratíva sa nezaoberala ani jedným z týchto odporúčaní. Náš príbeh pridal informácie, ktoré sa nikde inde nenašli o konkurenčných záujmoch, o ktoré ide.