masto.es es uno de los varios servidores independientes de Mastodon que puedes usar para participar en el fediverso.
Bienvenidos a masto.es, el mayor servidor de Mastodon para hispanohablantes de temática general. Registros limitados actualmente a invitaciones.

Administrado por:

Estadísticas del servidor:

1,9 K
usuarios activos

#bigdata

10 publicaciones10 participantes0 publicaciones hoy
Continuó el hilo

So, like, #bigdata exists. Everybody already knows that. So analytical systems use things like Apache #spark ...the sparkitecture. I obviously can not use words like "sparkitecture" in my work, so you get to see it here instead. Okay. Simple enough so far? The sparkitecture needs to store the data somewhere, though. How do you guarantee data security?

Kriminelle Vereinigung Twi-X

Jedenfalls in Frankreich ist Twi-X als Kriminelle Vereinigung (dortige Bezeichnung: Organisierte Bande) angeklagt. Die beiden Vorwürfe lauten

Manipulation der öffentlichen Meinung (zum Zwecke der Wahlbeeinflussung) und
Datensammlung.

Wohlgemerkt, hier geht es um strafrechtliche Ermittlungen, keine zahnlosen Tiger wie DMA oder DSA.

pc-fluesterer.info/wordpress/2

www.pc-fluesterer.infoKriminelle Vereinigung Twi-X | pc-flüsterer bremen

Can anyone recommend good reads on how astronomical #bigdata is being managed, given the massive volumes coming in from, e.g. radio telescopes? Looking for mid-range accessibility, with some technical depth, but not specific to any one telescope or pipeline - more surveys/summaries of the kinds of architectural patterns / platforms, storage & retrieval tools. TIA & please boost for reach!

Verfassungsbeschwerde

Das Problem heißt nicht nur Palantir

Bayern fängt sich wegen der automatisierten Datenanalyse im Polizeigesetz eine Verfassungsbeschwerde ein. Dass es ausgerechnet die Software des rechten Milliardärs Peter Thiel sein muss, ist dabei nicht der Kern des Problems, sondern das Zusammenführen und heimliche Rastern einer großen Datenfülle aus verschiedensten Polizeisystemen.

Die Gesellschaft für Freiheitsrechte hat es wieder getan: In einer heute veröffentlichten Beschwerde an das Bundesverfassungsgericht legt sie im Namen von acht Beschwerdeführern dar, wo das bayerische Polizeiaufgabengesetz über die Grenzen des Erlaubten hinausreicht. Sie kommt zu dem Schluss, dass sich der Gesetzgeber im Freistaat nicht ausreichend an die bereits detailliert vorliegenden Vorgaben aus Karlsruhe gehalten hat.

Denn die GFF hatte bereits im Jahr 2023 ein Urteil des Bundesverfassungsgericht erkämpft, das damals ähnliche gesetzliche Befugnisse aus Hamburg und Hessen für verfassungswidrig erklärte. Diesem Urteil Geltung zu verschaffen, aber auch „klarere Grenzen für den Einsatz von Data-Mining-Software“ zu ziehen, ist das erklärte Ziel der Beschwerde.

Es geht also wieder um die automatisierte Datenanalyse durch die Polizei, die ihren Wildwuchs von Datenbanken nicht nur zähmen, sondern vor allem die Daten darin erschließen will. Dafür setzt sie aktuell auf das Softwareprodukt Gotham des US-Konzerns Palantir. Mit dieser Software werden in großem Umfang personenbezogene Polizeidaten aufbereitet und analysiert. Millionen Datenhäppchen über Menschen, die mit der Polizei irgendwann Kontakt hatten, fließen in diese Schattendatenbanken hinein. Oft diskriminierte Gruppen sind besonders betroffen und selbst Berufsgeheimnisträger wie Anwälte, Journalisten oder Ärzte werden nicht verschont und können mitgerastert werden.

“Rechter Verschwörungsideologe Peter Thiel”

Neben den massiven Eingriffen in die informationelle Selbstbestimmung aller dadurch betroffenen Menschen ist auch die starke Abhängigkeit problematisch, in die sich die Polizei begibt. Denn ohne die Palantir-Softwarehilfe ist das Auswerten der eigenen Datenbestände umständlich und zeitaufwendig. Darauf weisen Polizeivertreter bei jeder Gelegenheit hin.

Während die Abhängigkeit an sich bereits eine Herausforderung ist, weil man sich eben langfristig an einen kommerziellen Anbieter bindet, dessen Geschäftsinteressen von den Polizeiinteressen abweichen können oder der sein Geschäftsmodell ändern könnte, so ist speziell dieser US-Konzern als Partner der Polizei eine echte Zumutung. Denn nicht nur der Mitgründer und Großaktionär Peter Thiel, sondern auch der Palantir-Chef Alexander Karp fallen seit Jahren und in zunehmendem Maße durch öffentliche Aussagen auf, die Zweifel nähren, ob für sie Menschenrechte und Demokratie einen Wert haben.

Einer der acht Beschwerdeführer, der Musiker und Aktivist gegen des Polizeigesetz Johannes König, bringt es so auf den Punkt:

Als wäre das bayerische Polizeiaufgabengesetz noch nicht autoritär genug geprägt, setzt die Staatsregierung nun auch noch auf die Überwachungssoftware des rechten Verschwörungsideologen Peter Thiel.

Denn Milliardär Thiel ist ein offensiver rechts-libertärer Kulturkämpfer und Nationalist. Zudem hat der vor 22 Jahren gegründete Konzern dauerhafte und langjährige Verbindungen zu den US-Geheimdiensten und -Militärs, ohne deren Millionenverträge Palantir gar nicht existieren würde. Denn viele Jahre wurde der sektenartige Softwarekonzern von einem CIA-Ableger mitfinanziert und wies niemals Gewinne aus.

Auch zur Trump-Regierung gibt es enge Verbindungen und eine anbiedernde Position der prominenten Palantir-Gesichter Thiel und Karp. Dass Palantir-Software in Kriegsgebieten von Geheimdiensten und Militärs genutzt wird, unterstützt die Trump-Regierung nach Kräften.

Die Zweckbindung untergraben

Die Funktionsweise des Palantir-Produkts ist nur soweit öffentlich nachvollziehbar, wie es der Polizei-Vertragspartner erlaubt. Diese Undurchsichtigkeit könnte behoben werden, wenn ein anderer Vertragspartner zum Zuge käme oder eine eigene Softwarelösung genutzt würde. Aber das löst noch nicht das eigentliche Problem, nämlich welche Daten unter welchen Bedingungen in die automatisierte Analyse einfließen dürfen.

Denn so unverständlich es erscheint, dass im bayerischen Innenministerium auch nach jahrelangen Diskussionen auf den abgründigen Tech-Konzern gesetzt wird, so wenig sollte man sich den Blick auf das Wesentliche verstellen lassen: Palantir ist nicht der Kern des Problems, sondern das Ansinnen, die Zweckbindung polizeilich aufgenommener Daten zu untergraben und letztlich aufzulösen.

Das Zusammenführen und die Analyse von Daten aus polizeilichen Verbunddateien, aus großen Polizeidatenbanken und aus den verschiedenen Fallbearbeitungs- und Auskunftssystemen darf nicht dazu führen, dass aus bloßen praktischen Erwägungen oder weil im konkreten Fall ohnehin niemand genau weiß, wie die Palantir-Software arbeitet, wichtige rechtlichen Schranken wegfallen.

Denn es ist nicht nur eine heimliche, sondern eben auch eine gefährliche Ermittlungsmaßnahme, wenn hinter den Rücken der Menschen die Daten aus den Polizei-Datenbanken gerastert und analysiert werden, die im Vertrauen darauf an die Behörden gegeben wurden, dass mit ihnen sorgsam umgegangen wird. Tritt etwa ein Zeuge eines Diebstahls an die Polizei heran oder wird ein Verkehrsunfall polizeilich aufgenommen, dann sollte niemand der Beteiligten Angst haben müssen, automatisiert in Analysewerkzeugen zu landen, die ihn später mit anderen Straftaten in Verbindung bringen und ihm Überwachungsmaßnahmen bescheren können.

Offenlegung: Der Chaos Computer Club unterstützt die Verfassungsbeschwerde der GFF. Die Autorin ist ehrenamtlich Sprecherin des CCC. Constanze Kurz ist promovierte Informatikerin, Autorin und Herausgeberin von Büchern, zuletzt Cyberwar. Ihre Kolumne „Aus dem Maschinenraum“ erschien von 2010 bis 2019 im Feuilleton der FAZ. Sie lebt in Berlin und ist ehrenamtlich Sprecherin des Chaos Computer Clubs. Sie war Sachverständige der Enquête-Kommission „Internet und digitale Gesellschaft“ des Bundestags. Sie erhielt den Toleranz-Preis für Zivilcourage und die Theodor-Heuss-Medaille. Kontakt: E-Mail (OpenPGP). Dieser Beitrag ist eine Übernahme von netzpolitik, gemäss Lizenz Creative Commons BY-NC-SA 4.0.

Über Constanze Kurz - netzpolitik:

Unter der Kennung "Gastautor:innen" fassen wir die unterschiedlichsten Beiträge externer Quellen zusammen, die wir dankbar im Beueler-Extradienst (wieder-)veröffentlichen dürfen. Die Autor*innen, Quellen und ggf. Lizenzen sind, soweit bekannt, jeweils im Beitrag vermerkt und/oder verlinkt.

extradienst.netVerfassungsbeschwerde – Beueler-Extradienst

🕸glané sur le net🕸 Souveraineté numérique ou soumission technologique ? À propos des centres de données au Brésil et de la rencontre entre Haddad et les géants de la technologie: Nous devons empêcher que notre pays redevienne la « ferme » du monde, où cette fois-ci, les matières premières seront les données des Brésiliens, nos ressources naturelles et nos ressources énergétiques. Photo : Rencontre… europe-solidaire.org/spip.php? #SouverainetéNumérique #Technologie #BigData #EconomieNumérique #Bresil

www.europe-solidaire.orgSouveraineté numérique ou soumission technologique ? À propos des centres de données au Brésil et de la rencontre entre Haddad et les géants de la technologie - Europe Solidaire Sans Frontières Nous devons empêcher que notre pays redevienne la « ferme » du monde, où cette fois-ci, les matières premières seront les données des Brésiliens, (…)

Twi-X missbraucht sensible Daten der Benutzer/innen

Mehrere NGO haben bei verschiedenen Aufsichtsbehörden Beschwerde eingelegt, weil Twi-X die DSGVO und den DSA verletze. Der verbietet es, Informationen über politische Einstellung oder Gesundheit einer Person für zielgerichtete Werbung

pc-fluesterer.info/wordpress/2

www.pc-fluesterer.infoTwi-X missbraucht sensible Daten der Benutzer/innen | pc-flüsterer bremen

🗣️ Announcing Python-Blosc2 3.6.1

!Unlock new levels of data manipulation with Blosc2! 🚀

We've introduced a major improvement: powerful fancy indexing and orthogonal indexing for Blosc2 arrays.

We've tamed the complexity of fancy indexing to make it intuitive, efficient, and consistent with NumPy's behavior. 💪

Read all about it on our blog! 📝 blosc.org/posts/blosc2-fancy-i

Compress Better, Compute Bigger!

📣 Call for Papers!

Das vom @berliner_antike_kolleg mit DAI, @BBAW, @freieuniversitaet und @HumboldtUni organisierte #DigitalClassicistSeminar Berlin geht von Oktober '25 bis Februar '26 in die nächste Runde.

Insbesondere Nachwuchswissenschaftler:innen sind eingeladen, bis zum 🗓️ 16.08. Beiträge zu digitalen Methoden, Herausforderungen von #BigData, #Visualisierungen u.v.m. einzureichen.

👉 Den vollständigen #CfP gibt es hier: digital-classicist.bbaw.de/cfp

digital-classicist.bbaw.deCall for Papers - Digital Classicist SeminarBBAW Description.

What does it take to maintain one of the world's largest repositories of free, structured knowledge?

Read this interview about the challenges Wikidata faces and how the team handles massive scale and constant updates, all while remaining open source:
bigdatawire.com/2025/07/10/sca #OpenData #KnowledgeGraphs #BigData #SemanticWeb

BigDATAwire · Scaling the Knowledge Graph Behind WikipediaAs the fifth most popular website on the Internet, keeping Wikipedia running smoothly is no small feat. The free encyclopedia hosts more than 65 million