digitalcourage.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
Diese Instanz wird betrieben von Digitalcourage e.V. für die Allgemeinheit. Damit wir das nachhaltig tun können, erheben wir einen jährlichen Vorausbeitrag von 1€/Monat per SEPA-Lastschrifteinzug.

Server stats:

813
active users

#bigdata

9 posts9 participants0 posts today

Twi-X missbraucht sensible Daten der Benutzer/innen

Mehrere NGO haben bei verschiedenen Aufsichtsbehörden Beschwerde eingelegt, weil Twi-X die DSGVO und den DSA verletze. Der verbietet es, Informationen über politische Einstellung oder Gesundheit einer Person für zielgerichtete Werbung

pc-fluesterer.info/wordpress/2

www.pc-fluesterer.infoTwi-X missbraucht sensible Daten der Benutzer/innen | pc-flüsterer bremen

🗣️ Announcing Python-Blosc2 3.6.1

!Unlock new levels of data manipulation with Blosc2! 🚀

We've introduced a major improvement: powerful fancy indexing and orthogonal indexing for Blosc2 arrays.

We've tamed the complexity of fancy indexing to make it intuitive, efficient, and consistent with NumPy's behavior. 💪

Read all about it on our blog! 📝 blosc.org/posts/blosc2-fancy-i

Compress Better, Compute Bigger!

📣 Call for Papers!

Das vom @berliner_antike_kolleg mit DAI, @BBAW, @freieuniversitaet und @HumboldtUni organisierte #DigitalClassicistSeminar Berlin geht von Oktober '25 bis Februar '26 in die nächste Runde.

Insbesondere Nachwuchswissenschaftler:innen sind eingeladen, bis zum 🗓️ 16.08. Beiträge zu digitalen Methoden, Herausforderungen von #BigData, #Visualisierungen u.v.m. einzureichen.

👉 Den vollständigen #CfP gibt es hier: digital-classicist.bbaw.de/cfp

digital-classicist.bbaw.deCall for Papers - Digital Classicist SeminarBBAW Description.

What does it take to maintain one of the world's largest repositories of free, structured knowledge?

Read this interview about the challenges Wikidata faces and how the team handles massive scale and constant updates, all while remaining open source:
bigdatawire.com/2025/07/10/sca #OpenData #KnowledgeGraphs #BigData #SemanticWeb

BigDATAwire · Scaling the Knowledge Graph Behind WikipediaAs the fifth most popular website on the Internet, keeping Wikipedia running smoothly is no small feat. The free encyclopedia hosts more than 65 million

🚀 Blosc2 supports memory-mapped files for super-efficient data access! 🚀

✨ Why memory-mapping?
1️⃣ No system call overhead for each read/write
2️⃣ Data goes straight from page cache to user space—much faster than traditional I/O!

👉 github.com/Blosc/python-blosc2

Join our tutorial at
@EuroSciPy 2025, where we'll dive deep into these techniques and share more expert tips for maximizing data throughput. See you there!

#DataScience #Performance #BigData 🚀💾

Fortschritt: Google Android spioniert jetzt noch brutaler.

Google informiert seine Nutzer/innen, dass sie ab sofort durch die KI Gemini unterstützt werden - ob sie es wollen oder nicht. Gemini erhält dafür Zugang zu allen Apps, auch zu verschlüsselnden Messengern. Lokal liegen die Inhalte ja im Klartext vor, und darauf will Gemini zugreifen. Ist das der Anfang von Quellen-TKÜ (vulgo Chatkontrolle)? Googles Vorstoß riecht ziemlich streng nach Salami-Taktik in diese Richtung.

pc-fluesterer.info/wordpress/2

www.pc-fluesterer.infoFortschritt: Google Android spioniert jetzt noch brutaler. | pc-flüsterer bremen
Replied in thread

@jomla Yes, definitely some #BigData vibes there. Same story, 10-15 years ago. We should learn from it. What we need instead of hype or doom, imho, is intense, critically-engaged, task-oriented evaluation to see what works, what is helpful, what are unhelpful scenarios, how this stuff transfers to our domain, etc. Many in #DH are starting to do just that, so I am hopeful.

Jak przetworzyć 10 milionów plików PDF z ministerialnych raportów i zbudować z tego działający serwis publiczny? Tomasz Zieliński opowiedział o kulisach powstania SLPS - od walki z danymi, przez ekstrakcję tekstu i analizę niezgodności, po budowę wydajnego systemu i jego niskokosztowy hosting.

Zobacz wykład z OMH 2024 i przygotuj się na tegoroczną edycję:
▶️ youtube.com/watch?v=PJHNkX0XP50 🍿

🎫 Rejestracja na Oh My Hack 2025 trwa ➡️ bit.ly/OMHbilet

🚀 Announcing Python-Blosc2 3.5.1

We, Blosc developers, understand that memory efficiency is critical when working with large datasets. To that end, we continuously profile and optimize our codebase to deliver the best possible performance.

This version introduces significant performance and memory optimizations, enhancing the experience of computing with large, compressed datasets.

Compress Better, Compute Bigger!

Meta’s AI copyright win comes with a warning about fair use

“This ruling does not stand for the proposition that Meta’s use of copyrighted materials to train its language models is lawful,” Judge Chhabria said.

“It stands only for the proposition that these plaintiffs made the wrong arguments and failed to develop a record in support of the right one.”

#meta #LlamaAI #artificialintelligence #AI #LLM #data #bigdata #l3gal #copyright #fairuse #technology #tech

theverge.com/news/693437/meta-

The Verge · Meta’s AI copyright win comes with a warning about fair useBy Jay Peters