2.4. First Test with Bare Conductive’s Touch Board

In this post, I’m documenting my first hands-on test with the Touch Board by Bare Conductive. After choosing it for its built-in capacitive touch sensors and MP3 playback, I wanted to validate whether this microcontroller could support the kind of screen-free, tactile storytelling I’m imagining, where visitors trigger audio simply by touching a point on a surface.

The Touch Board is basically an Arduino-compatible microcontroller designed for sound-based interactions.

It comes with:

  • 12 capacitive touch electrodes (E0-E11)
  • Built-in microSD card slot for MP3s
  • Audio jack and speaker terminal
  • Micro-USB for power and programming

What I Used

  • 1x Touch Board
  • 1x microSD card
  • 1x microSD card reader
  • 1x Speaker
  • 1x USB cable (for power and code upload)
  • 1x LED (for basic feedback)
  • 1x 220 Ohm resistor
  • 1x Breadboard
  • 3x Jumping Wires
  • Bare Conductive’s “Touch MP3 with LEDs” example code

Basic Wiring

The Touch Board’s default “Touch MP3” code links each of the 12 electrodes (E0-E11) to a corresponding MP3 file on the microSD card. When you touch an electrode, it plays the matching audio clip.

To make the interaction more multisensory and responsive, I added a simple LED feedback: when a sound plays, the LED lights up.

Here’s how I wired it:

  • Connected Touch Board’s GND to the breadboard’s ground rail using a jumper wire.
  • Placed a red LED on the breadboard.
  • Connected the long leg (anode) of the LED to a 220Ω resistor.
  • Connected the short leg (cathode)  to the breadboard’s ground rail using a jumper wire.
  • Connected the other end of the resistor to one of the Touch Board’s pins using a jumper wire.

For more detailed instructions, check out this helpful tutorial: https://www.instructables.com/Touch-Board-and-LEDs/

First Test

Touching one of the electrodes triggered a short sound from the speaker. At the same time, the LED lit up, confirming that the interaction was happening.

Here’s a short video testing this simple interaction.

Observations

  • Responsiveness: Very fast, almost too sensitive. Occasionally triggered by nearby touches or objects.
  • Satisfaction: The sound + light combo made the interaction feel clear and complete.
  • Compactness: Everything fit neatly on one board. No need for additional modules at this stage.

Next Steps

For wrapping up this lo-fi prototype, I will:

  • Add more electrodes and connect multiple LEDs
  • Try using conductive ink or custom-designed graphics as touchpoints
  • Test a portable setup powered by a USB power bank
  • Design audio content that reflects unusual or hidden stories from Graz

Reflections

This first test confirmed that the Touch Board is a great fit for early-stage, lo-fi prototyping. It’s easy to set up, intuitive to work with, and lets me focus on designing interactions, not just solving hardware problems. More importantly, it opened up space for experimenting with storytelling, mapping emotion, sound, and place onto physical interaction. I’m excited to continue developing this idea and exploring how each touchpoint might reveal a different layer of the city.

Perspektivische Präzision und visuelle Abstraktion beim Mapping sakraler Architektur

Im Zuge der texturbasierten Projektion auf eine Kirchenfassade mittels HeavyM zeigte sich, dass die perspektivische Ausrichtung nicht vollständig stimmig war. Eine Überprüfung der zugrunde liegenden 3D-Geometrie ergab, dass insbesondere die beiden Seitenteile entlang der Y-Achse leicht zu hoch positioniert worden waren. Diese Ungenauigkeit führte zu Anpassungen am Modell sowie zu weiteren Experimenten mit Perspektive und Warping innerhalb von HeavyM.

Daraus entwickelte sich die Überlegung, die Fassade nicht ausschließlich frontal zu bemappen, sondern auch seitlich anzusteuern, um einen räumlich überzeugenderen 3D-Effekt zu erzeugen. Voraussetzung dafür ist eine exakte Übereinstimmung der Perspektive zwischen virtuellem Modell und realer Architektur. Diese konnte durch die Verwendung des Photogrammetrie-Meshes aus Polycam gewährleistet werden. Dennoch entstehen während der realen Projektion perspektivische Verzerrungen, die durch gezieltes Warping im Mapping-Tool kompensiert werden müssen.

Obwohl verschiedene Textur-Experimente interessante gestalterische Erkenntnisse lieferten, erwies sich ein reduziertes, abstraktes Schwarz-Weiß-Mapping als geeigneter, um die sakrale Architektur aus ihrem festgelegten kulturellen Kontext zu lösen. Farbintensive oder symbolisch aufgeladene Texturen tendieren dazu, die bestehende religiöse Bedeutungsebene zu verstärken. Ein minimalistischerer Zugang ermöglicht hingegen eine offenere, atmosphärische Interpretation der Raumstruktur.

Für die Gestaltung der Visuals wurden auf Basis des Polycam-Meshes sämtliche Kanten in Splines umgewandelt. Diese Splines wurden mit einem sogenannten “Seil-Tag” versehen, wodurch sie dynamisch reagierten und in eine physikalische Simulation eingebunden werden konnten. Durch den Einsatz von Kräften wie Turbulenz, Gravitation, Wind und Kraftfeldern entstanden organisch anmutende, abstrakte Animationen. Diese bewegten sich scheinbar intuitiv über die architektonische Struktur und eröffneten neue Möglichkeiten in der Wechselwirkung zwischen Raum, Bewegung und Projektion.


Disclaimer zur Nutzung von Künstlicher Intelligenz (KI):

Dieser Blogbeitrag wurde unter Zuhilfenahme von Künstlicher Intelligenz (ChatGPT) erstellt. Die KI wurde zur Recherche, zur Korrektur von Texten, zur Inspiration und/oder zur Einholung von Verbesserungsvorschlägen verwendet. Alle Inhalte wurden anschließend eigenständig ausgewertet, überarbeitet und in den hier präsentierten Beitrag integriert.

Autofreie Mustersiedlung Floridsdorf

Nachdem ich leider meinen ursprünglichen Plan, ein Event von Auto:Frei:Tag in Graz zu dokumentieren, im Endeffekt doch nicht durchführen konnte, habe ich nach möglichen Alternativen gesucht. Um beim ungefähren Thema zu bleiben, habe ich schlussendlich bei meiner Tante angefragt, ob sie bereit wäre ein Interview zu geben über die autofreie Siedlung in Wien, in der sie inzwischen seit fast 25 Jahren wohnt.

Vor dem Interview habe ich ein wenig Recherche betrieben um die richtigen Fragen stellen zu können und zu wissen, worauf ich meinen Fokus beim Filmen legen will. Leider ist es durch den nun recht knappen Zeitplan nicht mehr möglich gewesen, eine detaillierte Shotlist zu erstellen, stattdessen habe ich einfach vor Ort abgewartet, was beim Interview erwähnt wird und anschließend eine Runde durch das Areal gedreht und darauf geachtet, genügend passendes b-roll Material zu sammeln.

Im Folgenden möchte ich, als Einleitung in die neue Thematik, die Ergebnisse meiner Recherche zur autofreien Mustersiedlung kurz zusammenfassen.

Die 1999 erstmals bezogene Siedlung in Wien Floridsdorf war damals einzigartig und ist das heute immer noch. Es handelt sich hierbei um den einzigen Wiener Wohnkomplex, bei dem die Verpflichtung zum Verzicht auf ein eigenes Auto im Mietvertrag als Klausel zum Einzug steht. Um das Projekt zu ermöglichen wurde sogar 1996 eine Anpassung des Wiener Garagengesetzes vorgenommen, damit nicht mehr ein Autostellplatz pro Haushalt errichtet werden musste, sondern die Zahl auf bis zu 10% reduziert werden konnte (Ziegler, 2023).

Trotz der eigentlichen Verpflichtung zum autofreien Leben bei Einzug in die Siedlung, besitzen circa 10 bis 15 Prozent der Bewohner:Innen ein eigenes Auto und unter bestimmten Umständen ist das auch in der Vertragsklausel vorgesehen. Dass ein Großteil trotzdem konsequent auf ein eigenes Auto verzichtet liegt, laut Karl Wurm – ehemaliger Geschäftsführer der Gewog – auch an sozialem Druck und einem Gefühl der Gruppenzugehörigkeit innerhalb der Siedlung. Außerdem wir das autofreie Leben dadurch belohnt, dass die Kosten, welche gespart wurden weil weniger Stellplätze benötigt wurden, direkt in Gemeinschaftsangebote investiert wurden (Zoidl, 2021).

In der Autofreien Mustersiedlung gibt es vielseitige Angebote, von diversen Gemeinschaftsräumen wie zum Beispiel ein Partyraum, ein Fitnessbereich und eine hauseigene Saune, über Hochbeete auf dem Dach, ein Biotop im Innenhof und unterschiedliche Werkstätten bis hin zu einem Biolager für Lebensmittel reichen. Diese Angebote können von den Bewohner:Innen niederschwellig genutzt werden und sorgen so für eine starke Hausgemeinschaft in der man sich gegenseitig kennt und unterstützt. Ein weiterer Pluspunkt für das Wohnen in der Siedlung sind die vergleichsweise niedrigen Betriebskosten, welche nur etwa 60% derer von vergleichbaren Wohnprojekten betragen. Das kann mitunter darauf zurückgeführt werden, dass die Bewohner:Innenschaft einen Beirat stellt, welcher der Hausverwaltung hilft beziehungsweise diese auch überprüft (Ziegler, 2023).

Neben den zahlreichen Gemeinschaftsräumen bietet die Siedlung auch diverse Initiativen für ihre Bewohner:Innen an, beziehungsweise werden diese von Bewohner:Innen selbst ins Leben gerufen. Zum Beispiel gibt es ein jährliches Siedlungsfest mit Essen, Trinken und Live-Musik, einen monatlichen AbHof Markt, einen jährlichen Flohmarkt, gemeinsames Handarbeiten, einen Silvesterpfad, Jazzbrunch, Adventmarkt, diverse Workshops, und vieles mehr. Außerdem gibt es eine hauseigene Siedlungsband sowie einen Chor (autofreie Mustersiedlung Floridsdorf, 2025).

Zusammengefasst muss ich zugeben, dass ich zu Beginn meiner Recherche schlicht und einfach dachte, es handelt sich um eine Siedlung in der keine Autos fahren oder parken dürfen. Obwohl meine eigene Tante dort seit fast 25 Jahren wohnt, war mir nicht bewusst dass es sich bei der “Autofreiheit” um eine verpflichtende Vereinbarung aller Bewohner:Innen handelt. Ich wusste außerdem nicht, dass hinter “autofrei” noch so viel mehr steckt, dass es sich auch um eine Gemeinschaft mit gleichen Werten und Weltansichten handelt, und dass so viele Initiativen und Angebote existieren, die weit darüber hinausgehen, dass schlichtweg keine Autos fahren. Ob nun die Gemeinschaft und das offenbar blühende Sozialleben der Siedlung einzig und allein auf den Verzicht auf ein Auto zurückzuführen sind, oder ob vielleicht Personen die gewillt sind auf ein eigenes Auto zu verzichten, gleichzeitig auch auf der Suche nach gleichgesinnten und Gemeinschaft sind, sei dahingestellt.

Ich habe versucht, in meiner Recherche möglichst viele Informationen einzuholen und mir ein umfassendes Bild der Lage zu machen, ohne mir dabei aber eine eigene Meinung zu bilden. Ich denke, dass diese Vorbereitungen recht hilfreich und zielführend für mein Interview waren.

Literatur:

WebExpo Conference

I chose to take notes from the two talks: “Creating an effective & beautiful data visualisation from scratch” with Nadieh Bremer, and “Survival kit for advertising jungle” with Kateřina Huňová & Vladimír Zikmund.

Creating an effective & beautiful data visualisation from scratch

Speaker: Nadieh Bremer

Information about the talk from the web expo page: During this talk, Nadieh will show you how to create a unique, effective, and (dare we say it) beautiful chart using d3.js, a leading tool for creating interactive data visualisations online. Without any slides and starting from an empty white browser window, she’ll take you through all the nuts and bolts that go into coding and creating a chart with d3, showing you how, with just a little bit of out-of-the-box thinking, you can use SVG in the weirdest ways to get what you had envisioned.

Nadieh Bremer is a data visualisation designer with a background in astronomy and data science. In her talk, she showed us from scratch how to program a datavisualisation set in an artsy way.

My notes from the talk:

  • She chose live coding to show how easy it is to do it your self
  • Making art from Data
  • visualising important data to get it more out to people
  • important to compare data to average data to show what is important
    • the spikes in the data are the interesting factors
  • Using D3 page for code paches in her code
    • using svg
  • She uses colours to show differences in the data
    • what is below and under average
    • makes it a gradient to make it interesting and pretty
  • She uses labels for context, or else the visualisation does not make sense
  • how she chose to show the data: dots
  • d3 annotations

In the end of her talk, she presented her finalised data-visualisation. It was impressive to watch her make it so easily, and I now feel like I could actually so something similar myself. I think it is easy to be scared of trying to code something – since the programming universe seems so advanced. That is why I liked Nadieh´s approach so much, especially how chill she presented it as well.

Survival kit for advertising jungle


Speakers: Kateřina Huňová & Vladimír Zikmund

information about the talk from web expo site: Kateřina and Vladimír will share 10 practical tips on how to survive in the advertising jungle. With the growing complexity of marketing, it’s getting harder to navigate from brief to campaign goal and the risk of getting lost during the process is ever-growing. As they have lived in this jungle for the last 10 years, they have created the survival kit to help you reach your goals and get as effective and creative as possible.

Kateřina is an Executive Creative Director at the advertising agency Zaraguza, and Vladimír is the Creative Director at the agency Zaraguza.

Notes from the talk:

  • It is easy to end up trying to do everything, ends up doing nothing
  • Klarna: very absurd memorable ad – but 1 simple message (fish sliding down a childrens slide)
    • good marketing
  • The Ordinary: we only care about science not influencers – also clever ad

Here are Katerina´s and Vladimir´s takes about what to think about when doing commercials:

  • integration: in one campaign you have concistency in every ad even though its different mediums
    • about one campaign
  • consistency is about long term
    • business ethics
    • consistent brands have +20% more
  • Snickers “you are not you when you are hungry”
    • concistent for many years
  • fluent device ads -> use a maskot
    • using a good guy
      • gives humor, something cute
    • or a dickhead (panda commercial)
  • duolingo maskot worked so well
    • turned into memes
    • got integrated into everything
  • “Climb the tree for better perspective”
  • get attention!
    • jeep – painted p-space in stupid places
    • birdhouses that sang incredible music pieces as ad for classical music shows
  • How to hande the trend moments – short term wave
    • brat summer is an example
    • following trends does very little for your brand, exept for engagement
    • if you do it, do it cheap, quick and funny
  • Cooperate with indiginous people (people with status?)
    • like Jeremy Allan White in Calvin Klein
      • then a random, not so pretty guy
    • does not work if you have no story or trustworthyness
      • kendall jenner with pepsi
  • Obstacles cant stop you
    • thats where you find creativity
    • knowing your brand
    • Its when you meet obstacles you learn
  • Remember to celebrate at the end!

This talk was interesting, first of all since I have never done anything like this. There were a lot of good tips, some of which I may be able to take with me – but i do think this commercial domain is not something I am particularily interested in, or something in which I would like to work in. Still, I will from now on have an extra eye for good commercials, and those worth judging.

KI Stimmen im Dokumentarfilm und in der Trailer Erstellung

In meiner täglichen Arbeit als Editorin im Bereich Dokumentarfilm ist man immer mit neuen Technologien konfrontiert, die unseren Workflow verändern – oder zumindest zum Überdenken anregen. Eine dieser Entwicklungen ist der Einsatz von KI-generierten Stimmen. Besonders bei redaktionellen Abnahmen und in der Trailer-Erstellung wurde in unserem Team zuletzt mit KI-Stimmen experimentiert, um die Vorstellungskraft bei unfertigen Filmfassungen zu verbessern.

In diesem Beitrag möchte ich einen praktischen Einblick geben, wie wir die Stimmen von ElevenLabs getestet haben und welche Probleme dabei aufgetaucht sind.

Anwendungsfall: Redaktionelle Abnahme mit KI-Stimme

Der klassische Ablauf bei uns sieht so aus: Der Roughcut eines Dokumentarfilms wird zusammen mit dem Sprechertext als Word-Datei an die Redaktion übermittelt. Diese prüft den Text, macht redaktionelle Änderungen und gibt Feedback. Danach gibt es den Picture Lock und daraufhin starten die Sprachaufnahmen im Tonstudio mit Sprecher:in, Regie und Tonmeister.

Um diesen Prozess zu unterstützen, kam die Idee auf, den Sprechertext nicht nur schriftlich zu liefern, sondern ihn über eine KI-Stimme einzusprechen und direkt in den Roughcut zu integrieren. Die Hoffnung war, der Redaktion so einen besseren Eindruck vom Timing, der Emotionalität und der Wirkung des Films zu vermitteln.

Technisch umgesetzt haben wir das mit ElevenLabs, einem Anbieter für KI-Stimmen, der besonders für seine natürlich klingende Sprachsynthese bekannt ist.

Erste Eindrücke aus der Praxis

Die Idee klang im ersten Moment vielversprechend – doch die Realität sah etwas anders aus.

Die Redaktion reagierte eher irritiert als begeistert. Die Gründe waren vielfältig:

  • Die Passagen waren oft zu lang oder zu kurz, weil die synthetische Stimme nicht wie ein Mensch pausiert oder moduliert. Das Timing passte also nicht zur Bildmontage.
  • Die Tonalität wirkte oft unpassend. Besonders bei emotionalen oder sensiblen Inhalten kam die synthetische Stimme zu neutral, zu technisch oder sogar ungewollt distanziert rüber.
  • Die KI-Stimme wurde fälschlich für einen Entwurf der Finalfassung gehalten, was Missverständnisse in der Kommunikation verursachte.

Fazit: Die Redaktion bat letztlich darum, wieder ausschließlich mit Word-Dokumenten zu arbeiten. Die gewünschte Verbesserung des Abnahmeprozesses blieb aus – zumindest in diesem Setting.

Bekannte Probleme beim Einsatz von ElevenLabs-Stimmen

Trotz der beeindruckenden Technologie gibt es einige klare Limitationen und Probleme, auf die man beim Einsatz von ElevenLabs achten sollte:

Unnatürliche Intonation und Betonung

  • KI-Stimmen setzen Betonungen oft an unerwarteten Stellen.
  • Komplexe Satzstrukturen, Fremdwörter oder Namen führen häufig zu fehlerhaften Aussprachen.
  • Pausen wirken technisch und nicht organisch – insbesondere bei emotional geladenen Passagen.

Tonalität schwer steuerbar

  • ElevenLabs bietet zwar verschiedene Emotionsprofile, doch deren Wirkung ist begrenzt und nicht konsistent.
  • Der Übergang zwischen ruhigen und aufgeregten Passagen klingt oft künstlich oder sogar verstörend.
  • Die Nuancen der menschlichen Stimme – Ironie, Zweifel, Wärme – lassen sich (noch) nicht ausreichend simulieren.
  • Bei längeren Texten treten hörbare Unterschiede auf wenn Passagen neu generiert werden müssen (z. B. plötzliche Stimmsprünge, veränderte Tonhöhe).

Fazit

Die Idee, KI-Stimmen in der redaktionellen Abnahme oder für Trailer-Entwürfe zu nutzen, ist technisch möglich – aber in der Praxis aktuell noch nicht ausgereift genug für den redaktionellen Alltag im Dokumentarfilm.

Insbesondere im öffentlich-rechtlichen oder journalistischen Kontext, wo Authentizität, Glaubwürdigkeit und emotionale Präzision zählen, stößt die Technologie (noch) an Grenzen.

Trotzdem: Die Potenziale sind da. Für interne Testfassungen, Vorvisualisierungen oder das kreative Experimentieren können Tools wie ElevenLabs durchaus hilfreich sein – solange man ihre Limitationen kennt und bewusst einsetzt.

Erstellung englischsprachiger Trailerfassungen 

Ein weiterer spannender Anwendungsbereich für KI-Stimmen hat sich bei uns in der Erstellung englischsprachiger Trailerfassungen ergeben. Während die deutsche Version wie gewohnt professionell eingesprochen wurde, testeten wir für die englische Adaption den Einsatz von KI-generierten Stimmen – wieder mit ElevenLabs als Tool der Wahl.


Gerade bei internationalen Vertriebsfassungen oder Festivalpräsentationen muss es oft schnell gehen – und das Budget für zusätzliche Sprecher:innen ist begrenzt. KI-Stimmen versprechen hier eine zeitsparende und kostengünstige Lösung.

Stimmfarbe und Präsenz:
Die Stimmen von ElevenLabs klingen zwar sauber und technisch beeindruckend, aber es fehlt häufig an der nötigen Körperlichkeit. Gerade in dramatischen Trailern braucht es eine „Wucht“ – ein Stimmvolumen, das tief in den Bauch geht.

Emotionale Dynamik:
Wechsel zwischen Spannung, Ruhe und dramatischem Höhepunkt – wie sie für gute Trailer typisch sind – wirken bei der KI oft flach.

Aussprache & Betonung:
Auch im Englischen waren teilweise Fremd- oder Eigennamen ein Problem – insbesondere deutsche oder osteuropäische Namen wurden unnatürlich betont.

Fazit aus der Trailer-Arbeit

KI-Stimmen können in der Trailerproduktion aktuell eine schnelle Vorschau liefern – z. B. für interne Präsentationen oder erste Vertriebspitches. Für finale, publikumswirksame Fassungen jedoch sind sie noch nicht ausgereift genug, um mit echten Sprecher:innen zu konkurrieren.

Die Stimme ist im Trailer mehr als Information – sie ist Teil der Inszenierung, in manchen Fällen sogar das emotionale Herzstück. Genau hier bleibt die menschliche Stimme unersetzlich.

Traumschlösser und Ritterburgen TRAILER 2025 EN

Austria’s Mountain Villages – Trailer (ENG)

https://vimeo.com/1094343948

KI-Editing: Kann eine KI den Rohschnitt übernehmen?

Während KI-generierte Bilder, Stimmen und Texte längst in der Kreativwelt angekommen sind, beginnt sich auch der Videoschnitt langsam zu verändern. Immer mehr Tools versprechen, Teile des Schnittprozesses zu automatisieren – vor allem dort, wo es um Struktur, Rhythmus und Textverständnis geht. Besonders im Rohschnitt, bei Interviews, Podcasts oder Social Clips, wächst das Potenzial. Für Dokumentationen gilt es bislang ewig bis keine Programme, deshalb bezieht sich diese Analyse primär auf andere Formate.

Die Frage ist, wie gut sind diese KI-Helfer wirklich? Können sie menschliches Schnittgefühl ersetzen oder sind sie nur clevere Assistenten? Um diesen Fragen genau auf den Grund zu gehen, habe ich 4 Programme genauer betrachtet Autopod, Descript, Pictory und AutoCut.

1. Autopod

Autopod ist ein Plugin für Adobe Premiere Pro, das automatisch zwischen Kameraperspektiven schneidet, primär perfekt für Podcasts oder Interviews mit mehreren Sprecher:innen. Die KI erkennt, wer spricht, und schaltet zur passenden Kameraansicht, ohne dass manuelle Schnittpunkte gesetzt werden müssen.

Stärken:

  • Extrem schnelle Erstellung eines Multicam-Rohschnitts
  • Individuell anpassbare Regeln für Kameraschnitte
  • Spart Stunden bei langen Interviews oder Diskussionsformaten

Schwächen:

  • Emotionale Reaktionen (Blickkontakt, stille Reaktionen) werden nicht erkannt
  • Für filmischere Formate mit dramaturgischem Feingefühl ungeeignet
  • Nur sinnvoll bei klaren Audioverhältnissen und separaten Mikrofonspuren

Preis: $29/Monat

2. Descript

Descript bietet einen textbasierten Ansatz: Das Videomaterial wird transkribiert und lässt sich wie ein Word-Dokument bearbeiten. Löscht man einen Satz im Text, entfernt die Software automatisch den dazugehörigen Clip. Ideal für Interviews, Tutorials oder Podcasts.

Stärken:

  • Intuitive Bedienung über Text – ideal für Nicht-Editor:innen
  • Automatische Entfernung von Füllwörtern und Pausen
  • Tolle Exportoptionen für Podcast, Video und Social Media

Schwächen:

  • Schnittlogik ist linear und reduziert – komplexe Szenen schwer umsetzbar
  • Keine filmische Gestaltung möglich (Schnittdynamik, Rhythmus)
  • Design und Typografie stark limitiert – visuelle Nachbearbeitung nötig

Preis: Hobbyist $24/Monat, Creator $35/Monat, Business $65/Monat

3. Pictory 

Pictory ist ein browserbasiertes Tool, das sich vor allem an Marketing- und Content-Teams richtet. Aus einem Video (z. B. Interview oder Webinar) generiert Pictory automatisch Kurzclips mit Untertiteln, passenden Schnitten und visuellen Highlights. Der Fokus liegt klar auf Social-Media-fähigem Content.

Stärken:

  • Gute Transkription und Keyframe-Erkennung
  • Schnelle Erstellung von 30–90 Sekunden-Clips mit Untertiteln
  • Effizient für Reels, LinkedIn-Snippets oder Insta-Stories

Schwächen:

  • Visuelle Qualität ist oft generisch
  • Erkennung wirklich relevanter Aussagen ist oberflächlich
  • Keine filmische Präzision, kein Dramaturgieverständnis

Preis: Starter $25/Monat, Professional $49/Monat, Team $119/Monat

4. AutoCut 

AutoCut ist ein Plugin für Adobe Premiere Pro und DaVinci Resolve, das auf KI-gestützte Automatisierung im Videoschnitt spezialisiert ist. Es richtet sich an Creator, Podcaster:innen und Content-Teams, die mit Talking-Head-Videos, Interviews oder Social Media Clips arbeiten. AutoCut analysiert Audio und Bild, entfernt Sprechpausen, setzt automatische Zooms, erstellt Untertitel und schneidet Multicam-Interviews auf Basis der Sprechererkennung.

Stärken:

  • Sehr gute Erkennung von Sprechpausen und automatische Entfernung
  • Schneller Multicam-Schnitt nach Sprecherwechsel (ideal für Podcasts)
  • Direkt in Premiere Pro / Resolve integriert, kein Wechsel ins Browser-Tool
  • Zusätzliche Features wie AutoZoom, AutoCaptions und AutoResize

Schwächen:

  • Dramaturgische Entscheidungen (z. B. Blickkontakt, Betonungen) bleiben KI verborgen
  • Transkriptionsfehler führen zu falschen Schnitten oder Untertitelproblemen
  • Visuelle Gestaltung (z. B. Layout der Captions) wirkt oft generisch
  • Für emotionale, dokumentarische oder künstlerische Schnitte ungeeignet

Preis: AI Plan $19,80/Monat

Fazit: 

Die getesteten Tools zeigen: KI kann bereits viel leisten, vor allem in Formaten, die strukturiert, repetitiv und sprachbasiert sind. Interviews, Podcasts, Webinare oder kurze Clips lassen sich in erstaunlicher Geschwindigkeit vorbereiten – das spart Zeit und Ressourcen. Wer ihre Stärken kennt und gezielt einsetzt, profitiert enorm. 

Was KI allerdings nicht kann: Emotionale Spannungsbögen erfassen, Bild-Ton-Dramaturgie gestalten, Subtext, Ironie oder Timing bewusst einsetzen

Der menschliche Schnitt bleibt weiterhin entscheidend – besonders in dokumentarischen, erzählerischen oder cineastischen Formaten. KI-Tools wie Autopod oder AutoCut sind effiziente Helfer, aber keine Erzähler.

Warum der Mensch (aktuell) im Schnittprozess unverzichtbar bleibt

Trotz aller beeindruckenden Fortschritte bleibt eines klar: Der Schnitt ist nicht nur ein technischer, sondern vor allem ein erzählerischer und ethischer Akt. Schnitt bedeutet Auswahl, Interpretation, Gewichtung – und oft auch Verantwortung gegenüber Menschen, deren Stimmen und Geschichten im Film sichtbar werden. Eine KI mag Tempo und Struktur automatisieren, aber sie versteht nicht, was sie erzählt. Sie kennt keine Zwischentöne, keine Intention, kein Mitgefühl. Besonders im dokumentarischen Kontext braucht es ein Gespür für Stimmung, Respekt, Spannung und Relevanz – all das sind Eigenschaften, die nur der Mensch im Schnittraum mitbringt. KI kann helfen, Prozesse zu beschleunigen, aber nicht ersetzen, was das Erzählen menschlich macht: Empathie, Kontext und die Fähigkeit, Bedeutung aus Bildern und Stimmen zu formen. Die kreative Verantwortung liegt – und sollte auch weiterhin – beim Menschen bleiben.

Quellen: https://www.autopod.fm

https://www.descript.com/?redirect=false

https://pictory.ai

https://www.autocut.com/en/

Storytelling mit KI: Kann eine KI ein Drehbuch schreiben?

Durch KI und den leichten Zugang dazu hat sich das kreative Schreiben vor allem in der letzten Zeit stark verändert – künstliche Intelligenz ist längst nicht mehr nur ein Werkzeug für Datenanalyse, sondern wird auch aktiv in künstlerischen Prozessen verwendet. 

Vom Verfassen von Gedichten bis hin zu Romanen: KI-gestützte Tools übernehmen inzwischen Aufgaben, die bis vor kurzer Zeit noch der Kreativität der Menschen vorbehalten waren. Doch wie sieht das beim Drehbuchschreiben aus, doch einer der anspruchsvollsten Formen des Storytellings. Gerade beim Drehbuch geht es um so viele kleine Nuancen, die das Gesprochene natürlich und authentisch machen. Kann KI hier auch gute Ergebnisse erzielen?

Kann eine KI dramaturgische Spannung erzeugen, emotionale Tiefe vermitteln und glaubwürdige Dialoge schreiben? Oder bleibt sie letztlich ein algorithmischer Imitator menschlicher Kreativität? Um diese Frage zu beleuchten, vergleiche ich in diesem Blogbeitrag zwei Drehbücher: eines komplett von ChatGPT generiert “ZEITSCHLEIFE” und eines mir selbst, das für den finalen Studiodreh in genau dieser Form verwendet wurde “TRAPPED IN THE LOOP”.

Generierung des KI-Drehbuchs:

Um das KI-Drehbuch zu erhalten, habe ich die KI mit folgenden Infos gefüttert und den Prompt folgend formuliert. Bestandteile waren die Szenecard, die Logline des Stücks allgemein und die Angaben aus dem Unterricht, der auch die Grundlage für das menschlich formulierte Skript waren.

„Schreibe ein Skript für eine kurze Szene mit folgenden Angaben:

INT. VERHÖRRAUM – POLIZEIWACHE – 2:00 NACHTS 

Kalter Raum. Neonlicht. Ein Tisch. Zwei Stühle.
Phil sitzt in einer Polizeiwache. Eine Kommissarin vor ihm. „Was ist passiert?“ 

Emotion
Phil ist voller Angst, Verzweiflung und Verwirrung. Kann zwischen Realität und Einbildung nicht mehr unterscheiden. Tiefe Trauer weil sein bester Freund ermordet wurde. 

Konflikt
Phil hat keine Erinnerung mehr.
War wirklich er der Mörder seines besten Freundes? 

Logline 

Ein exzessiver Partyabend wird für Phil, einen charismatischen, aber innerlich zerrissenen DJ, zum Albtraum, als er nach dem Konsum einer unbekannten Droge in einer Zeitschleife gefan- gen zu sein scheint. Vergangenheit, Gegenwart und Zukunft verschwimmen, und als er sich plötzlich vor einer Leiche wie- derfindet, stellt sich die Frage: Ist er der Mörder – oder nur ein Spielball seiner eigenen Wahrnehmung? 

Write a rough draft for the script of your chosen scene. 

1 page = 1 minute, so your script should be roughly 5 pages (excluding the cover page)

With regard to our studio shoot, the scene should include only one male and one female person of middle age (at least visibly on-screen).

A maximum of two sets should be used, which we can create in our studio (though thinking big is definitely encouraged).”

Der Outcome war folgendes Script:

Analyse und Vergleich der beiden Drehbücher

Struktur und Aufbau

Beide Drehbücher folgen aufgrund der Angabe und er Scenecard einer ähnlichen Grundstruktur: ein Verhörraum, eine Kommissarin, ein verwirrter Mann (Phil), ein mysteriöser Todesfall und eine rätselhafte Zeitschleife. 

Doch während der menschlich geschriebene Text stark zwischen Szenen wechselt – vom Verhörraum zur Party und wieder zurück. Das KI-Skript, das die Grundidee von „Trapped in a Loop“ also dem gefangen sein in einer Zeitschleife nicht ganz erfasst hat, bleibt in einer statischen Perspektive und erwähnt den Loop nur im Dialog. Der KI-Text fokussiert sich primär auf die Dialogszene im Verhörraum, was dramaturgisch dichter, aber auch weniger dynamisch wirkt.

Das echte Drehbuch hingegen nutzt filmische Stilmittel wie Match Cuts, Rückblenden und mentale Dissoziation, um die emotionale und narrative Verwirrung des Protagonisten visuell zu inszenieren und nicht nur sprachlich zu vermitteln. Der Szenenwechsel unterstützt den Plot: Realität und Erinnerung verschwimmen, was das Loop-Konzept glaubhaft und spürbar macht.

Dialog und Charaktertiefe

Im KI-Skript zeigt Phil emotionale Verzweiflung – Tränen, Zweifel, Erinnerungslücken. Auch die Kommissarin Keller ist klar gezeichnet: rational, aber mitfühlend. Dennoch wirken die Dialoge gelegentlich generisch und sehr aufgesetzt. Nichts was „Echte“ Menschen in so einem Fall sagen würden wenn sie wegen Mordverdachts auf einer Polizeiwache sitzen, etwa wenn Phil sagt: „Vielleicht war ich es. Vielleicht war ich es nicht.“

Im menschlich verfassten Skript hingegen ist die Sprache roher, direkter und glaubwürdiger. Die Kommissarin Lenz verliert mitunter die Geduld, ist fordernd, emotional, ungeduldig. Phil wechselt zwischen Panik, Nostalgie und purer Verzweiflung. Besonders eindrucksvoll ist eine Stelle, in der Phil schreit: „ICH VERSUCH JA ES IHNEN ZU ERKLÄREN!“, ein Ausbruch, der seine Zerrissenheit greifbar machen soll. Im Schreibprozess haben wir sehr stark den Fokus daraufgelegt, dass wir die Text so real und natürlich wie möglich gestalten. Denn im Endeffekt sind unsere Schauspieler:innen echte Menschen, mit österreichischem Background und daher war es wirklich wichtig, dass die Texte so gut wie möglich unserer gesprochenen Sprach ähneln. 

Themen und Tiefe

Beide Skripte behandeln existenzielle Themen: Schuld, Wahrnehmung, Realität und Zeit. Die KI thematisiert diese Ideen explizit: Phil spricht davon, in einer anderen Schleife seinen Freund retten zu können. Das ist philosophisch interessant, bleibt aber abstrakt.

Im echten Drehbuch verwebt die Themen subtiler ins Geschehen: Die Zeitschleife offenbart sich nicht nur im Text, sondern in der Struktur des Drehbuchs selbst. Wiederholungen, Fragmentierungen und sich überlagernde Realitäten spiegeln die psychische Lage von Phil. Die Zuschauer:innen sollen ebenso verloren wie die Hauptfigur und selbst nicht mehr ganz wissen, was real ist und was nicht.

Originalität und Innovationskraft

Die KI zeigt ein beachtliches Maß an handwerklicher Kompetenz: klare Szenenbeschreibung, dramatischer Aufbau, solide Dialogführung. Doch das Skript bleibt in bekannten KI-Scheme. Überraschungsmomente fehlen und der Text wird sehr künstlich und nicht nahbar.

Im Gegensatz dazu hat sich das menschlich geschriebene Skript anders orientiert: der narrative Loop ist nicht nur Thema, sondern auch Form. Das Spiel mit Zeitebenen und subjektiver Wahrnehmung ist komplexer und filmischer gedacht. 

Fazit: Wo liegt die Zukunft des Drehbuchschreibens?

Die KI hat beeindruckend gezeigt, dass sie Grundstrukturen und emotionale Dynamik eines Drehbuchs erfassen und wiedergeben kann. Ihre Texte sind formal korrekt, verständlich und atmosphärisch. Doch sie fehlen oft der Subtext, die emotionale Tiefe, die feinen psychologischen Nuancen. Kurz: die künstlerische Handschrift.

Menschliche also wirkliche Autor:innen bringt Intuition, Erfahrung und vor allem Gespür mit ein. Man weiß, wann man weniger sagt und mehr zeigt, wann ein Schnitt mehr erzählt als ein Satz.

Künstliche Intelligenz kann bereits heute ein wertvolles Werkzeug im kreativen Prozess sein: als Ideengeber, als Dialogvorschlaggeber, als dramaturgische Unterstützung oder auch einfach in der Korrektur. Aber die Rolle der Autor:innen, die aus Ideen eine Filmszene machen, bleibt, zumindest aktuell, menschlich.

Die spannendste Perspektive liegt wohl in der Zusammenarbeit und Kombination. Schön zu wissen, dass ein KI-Text zumindest aktuell in diesem Setting unseren Ansprüchen als Zuseher:innen und Filmemacher:innen nicht gerecht wird!

15 Creating a Web Interface for Arduino

Like I have teased in the last blog post, I came across a YouTube video, that showed, how to create a web interface for an Arduino. This has a number of use cases, live sensor monitoring, remote control, live system feedback or interactive installations. This makes it possible to control how the user can interact with an Arduino, using a platform, that they already know.

When the Arduino connects to a WiFi network, it gets an IP address and starts a tiny web server that can talk to web browsers. When you open that IP address in your browser, the browser sends a request to the Arduino. The Arduino responds with a simple web page, in my case a form in which you can write morse code. If you type something and click “Submit,” the browser sends the text back to the Arduino. The Arduino reads and understands the send information and can react accordingly. This way, the Arduino works like a tiny website, letting you interact with it through any browser.

I once again started with an example, I found in the WiFiS3 library of Arduino, “SimpleWebServerWiFi”. This code generated a very simple website with which you could turn on and off an LED on the Arduino. Using this as my starting point, I first wanted to expand the web interface, which took a little longer than it would usually take to build, since I had to upload the code multiple times and change it so it finally looked “good enough” for this prototype. But doing the interface it self was just the easy part.

Before
After

Next I wanted to give my simple interface some functionality, there for the form I created on the Arduino needed to send the data input by the user back to the Arduino, so it could understand and for now translate it. And I have to be honest, I really tried to understand the code but just couldn’t figure out, how it worked, so I asked ChatGPT to help me out. Using its infinite wisdom it created a short piece of code, that converted the users input into a string, that could be understood by the code, I had written before.

The next step was easy, I added the code for decoding the message, I created last week and explained in the last blog post. Now I just needed the Arduino to display the message, after it received one, which was easy enough by just adding an “if” statement, that would only add extra content to the website, if a message had been received before. And like that, I finished the next version of my chaotic morse code prototype.

Now that I’ve built this basic version, I’ve been thinking about how this kind of setup could be used in different contexts. For example, it could be adapted for interactive museum exhibits, where visitors can type a message into a browser on their phone and trigger lights, sounds, or physical movements in an installation. It could also be used for DIY home automation, like controlling lights. Or it might become a learning tool for kids, where they can experiment with inputs and immediately see results, helping them understand communication systems like Morse code in a playful, hands-on way.

Instructions

If you wanted to try it out yourself, here was what you needed:

  • An Arduino
  • a Laptop or any other device that can use a Browser ;D

This time it is even simpler, plugin the Arduino, change the SSID & Password to fit your home WiFi network and upload the sketch. In the Serial Monitor you will then see the Arduinos IP address, now open a browser and type in the shown IP address. Now you should see the simple interface I created, the only thing to do now is to write some morse code and let the Arduino decode it.

Blog Post 6: Designing wireframes for the prototype and Video of the prototype

This post focuses on the wireframing process for the Device App prototype, developed as part of my ongoing research into the role of Digital Memories in technology and interaction design. The goal of the wireframes was to translate research insights and conceptual direction into tangible, testable user flows. These wireframes represent the core flows of the prototype.

Starting With Sketches

I began the design process with rough sketches on paper to explore layout ideas quickly and think through user flows without constraints. This sketching phase allowed me to focus purely on functionality, flow logic, and visual hierarchy without getting distracted by UI details.

In the sketches, I explored the two key flows of the app:

  1. Adding Photos from a Connected Device
    • Users can connect a device via cable.
    • Choose to create a new folder or add to an existing one.
    • Photos are selected, reviewed, and saved into the desired folder.

  1. Viewing Photos as a Slideshow
    • Users can open any folder and launch a fullscreen slideshow.
    • A horizontal strip allows navigation between photos while viewing.

This paper-first approach helped me solidify the app’s structure before moving to Figma for the digital wireframes.

Building the Wireframes

Once the core flow was mapped out, I built detailed wireframes in Figma. The two main flows in the prototype are:

1. Add Photos Flow

Users connect a device, choose a folder (or create one), select photos, and upload them. The wireframes guide them step-by-step through this process with clear UI feedback like folder creation confirmation and selection indicators.

2. Slideshow Viewing Flow

Folders can be opened to view photos as a slideshow. This mode is minimal and immersive, offering a fullscreen photo experience with a navigation strip below.

Navigation and consistency were key considerations throughout. I maintained common buttons, tabs (like Add Photos / Saved Folders / Watch), and bottom navigation across screens to reduce friction and support intuitive exploration.

HOMESCREEN – Wireframe

ADD PHOTOS

CREATING NEW FOLDER FROM A DEVICE

Design Decisions

Some key choices I made:

  • Simplicity & Clarity: Especially important for intergenerational use.
  • Folder-Based Memory Organization: To give emotional context to digital memories.
  • Clear Action Paths: With visual hierarchy and button grouping to support user confidence.

FINAL LOW FIDELITY PROTOTYPE VIDEO

I was also describing the prototype so I reccomend to play the video in faster speed 1.5x. Thanks 🙂

Experiment IX: Embodied Resonance – From Offline to Online genaration

Our original objective was simple on paper: write a Python utility that would stream real-time heart-rate-variability (HRV) data from a live ECG feed and let a digital-audio workstation turn those numbers into music. The script was expected to read 0.1-second ECG chunks, detect new R-peaks, derive the seven canonical HRV metrics (HR, SDNN, RMSSD, VLF, LF, HF, LF/HF) and hand fresh values to the sound engine every tick. In theory that would allow a performer’s physiology to shape the soundtrack moment-by-moment.

Phase 1 – “print-only” prototype
The first proof-of-concept program did nothing but compute the metrics and dump them to the terminal. Because the offline reference library (hrv_plot.py) already produced correct numbers, the live version mimicked its algorithm line-for-line, apart from using a sliding buffer instead of reading the whole file at once. The console printed something every 0.1 s, CPU usage looked negligible, and we assumed we were done.

Phase 2 – OSC transport and the DAW deterrent
To let a synthesiser listen, we wrapped the same loop with an Open Sound Control sender. The data reached Ableton Live but required an external bridge, custom track routing and an additional plug-in to map OSC to parameters. Latency was fine, usability was not: every DAW session began with ten minutes of cabling virtual ports. We dropped OSC and decided to embed the information in ordinary MIDI where any host can record or map it instantly.

Phase 3 – first real-time MIDI attempt, and the “melting clock”
The next script converted each 0.1-s update into a drum hit on one of sixteen cells; HR controlled velocity, SDNN and RMSSD drove two CC lanes. For the first five seconds everything grooved, then tempo collapsed. Profiling showed peak detection becoming slower and slower: our buffer was ten seconds long, so every tick the detector rescanned an ever-growing vector. With 500 Hz sampling that was half a million points per second.

Phase 4 – carving the code into independent daemons
We split responsibilities into two stand-alone scripts:
hrv_live_print.py – generate just the metrics once every 0.1 s
ecg_to_drum_online.py – listen to the stream and build MIDI

The HRV process still lagged behind wall-time, so the music engine received late packets and eventually starved.

Phase 5 – “peak-triggered” optimisation and the HR crisis
To cut CPU we tried a different paradigm: compute HRV only when the detector reported a new R-peak; between peaks resend the previous values. That immediately fixed the frame-rate problem but created another: HR oscillated between plausible and absurd numbers (e.g. 40 → 140 → 55 bpm within one second). The fault was a race condition—the timestamp of the newest peak was sometimes outside the analysis window because the buffer indices were updated before the metric window limits. After correcting the order of operations HR stabilised within ±2 bpm of the offline truth. Unfortunately SDNN, RMSSD and especially the spectral powers still diverged by factors of two to ten.

Why the divergence never vanished

  • Time-domain spread metrics need at least fifty RR intervals; with resting heart-rate that is a full minute, which our 10-s buffer could never deliver, hence wildly inflated variance.
  • Spectral power below 0.15 Hz requires windows ≥ 120 s; shortening the segment erases low-frequency bins, so LF and VLF shrink to almost zero or explode at random.
  • Re-detecting peaks on a moving buffer changes the set of RR intervals at every tick, adding jitter no post-hoc analysis has to face.
  • Any attempt to enlarge the window brings back the original slowdown; shrinking it further removes the physiological meaning altogether.

Take-away – offline wins, HRV is not a live control signal
After weeks of profiling, refactoring and cheating (full-track pre-detection disguised as streaming) the conclusion is clear: classic HRV statistics are intrinsically retrospective. They trade temporal resolution for statistical power. In a concert-length performance the musician would have to wait one–three minutes before a genuine LF/HF change manifests, which is musically useless. Short windows restore immediacy but turn the output into coloured noise and defeat the scientific basis of HRV.

A narrow exception
Plain heart rate—computed from the last RR pair—can be broadcast at 10 Hz with negligible latency, so HR alone might still serve as a slow modulator. It is, however, a single scalar that drifts over tens of seconds; by itself it is too static to drive anything more than subtle filter sweeps.

Final verdict
For faithful physiology-driven sound the only robust path is to run a full offline analysis first or to invent new, deliberately short-window descriptors instead of relying on canonical HRV. The experiment showed that real-time HRV is a conceptual mismatch rather than a coding glitch, and that insight will save us from chasing the same mirage in future projects.