WAKE: Watermarking Audio with Key Enrichment

TL;DR

WAKE is the first key-controllable audio watermark framework, which aims to embed watermarks into audio and decode the embedded watermarks using specific keys, as shown in the following Figure. If an incorrect key is used, it will be impossible to decode the correct watermark, substantially enhancing the watermarking system's security and scalability while also fulfilling personalized watermarks. Notably, WAKE can achieve multiple watermark embeddings and corresponding watermark decoding based on the key used during embedding. WAKE outperforms the current state-of-the-art audio watermarking models in watermarked audio quality and decoding performance.

WAKE's overall process

Watermarked Audio Sample with different types of audio

Audio Event: Sampled from AudioSet
English Speech: Sampled from LibriSpeech
Other Speech: Sampled from CommonVoice
Music Data: Sampled from FMA
Other Data: Sampled from outside the train/test dataset
Spectrogram: spectrogram of samples

Multiple watermark embedding with different types of audio

different Watermark Times: Watermarked Audio with different Watermark Times(Audio Event)
different Watermark Times: Watermarked Audio with different Watermark Times(English Speech)
different Watermark Times: Watermarked Audio with different Watermark Times (music)
different Watermark Times: Watermarked Audio with different Watermark Times(other language speech)
spectrogram: spectrogram of different watermark embedding times

Audio Event

Sampled from AudioSet

	Sample 1	Sample 2	Sample 3	Sample 4	Sample 5	Sample 6	Sample 7	Sample 8
Origin Audio
AudioSeal (single watermark)
WavMark (single watermark)
WAKE (single watermark)
AudioSeal (double watermark)
WavMark (double watermark)
WAKE (double watermark)

Go Back to Table of Contents

English Speech

Sampled from LibriSpeech.

	Sample 1	Sample 2	Sample 3	Sample 4	Sample 5	Sample 6	Sample 7	Sample 8
Origin Audio
AudioSeal (single watermark)
WavMark (single watermark)
WAKE (single watermark)
AudioSeal (double watermark)
WavMark (double watermark)
WAKE (double watermark)

Go Back to Table of Contents

Other Language Speech

Sampled from CommonVoice.

	Sample 1	Sample 2	Sample 3	Sample 4	Sample 5	Sample 6	Sample 7	Sample 8
Origin Audio
AudioSeal (single watermark)
WavMark (single watermark)
WAKE (single watermark)
AudioSeal (double watermark)
WavMark (double watermark)
WAKE (double watermark)

Go Back to Table of Contents

Music Data

Sampled from FMA.

	Sample 1	Sample 2	Sample 3	Sample 4	Sample 5	Sample 6	Sample 7	Sample 8
Origin Audio
AudioSeal (single watermark)
WavMark (single watermark)
WAKE (single watermark)
AudioSeal (double watermark)
WavMark (double watermark)
WAKE (double watermark)

Go Back to Table of Contents

Other Data

Sampled from outside the train/test dataset.

	Sample 1	Sample 2	Sample 3	Sample 4	Sample 5	Sample 6	Sample 7	Sample 8
Origin Audio
AudioSeal (single watermark)
WavMark (single watermark)
WAKE (single watermark)
AudioSeal (double watermark)
WavMark (double watermark)
WAKE (double watermark)

Go Back to Table of Contents

Specgram

Sampled Randomly

	Sample 1	Sample 2	Sample 3
Origin Audio
AudioSeal (single watermark)
WavMark (single watermark)
WAKE (single watermark)
AudioSeal (double watermark)
WavMark (double watermark)
WAKE (double watermark)

Go Back to Table of Contents

Watermarked Audio with different Watermark Times(Audio Event)

Sampled from AudioSet.

	Origin Audio	1	2	3	4	5	6	7	8	9	10
AudioSeal
WavMark
WAKE

Go Back to Table of Contents

Watermarked Audio with different Watermark Times(English Speech)

Sampled from LibriSpeech.

	Origin Audio	1	2	3	4	5	6	7	8	9	10
AudioSeal
WavMark
WAKE

Go Back to Table of Contents

Watermarked Audio with different Watermark Times (music)

Sampled from FMA.

	Origin Audio	1	2	3	4	5	6	7	8	9	10
AudioSeal
WavMark
WAKE

Go Back to Table of Contents

Watermarked Audio with different Watermark Times(other language speech)

Sampled from CommonVoice.

	Origin Audio	1	2	3	4	5	6	7	8	9	10
AudioSeal
WavMark
WAKE

Go Back to Table of Contents

Specgram with watermark times

Sampled Randomly

	AudioSeal	WavMark	WAKE
Origin Audio
Watermark 1 time
Watermark 2 times
Watermark 3 times
Watermark 4 times
Watermark 5 times
Watermark 6 times
Watermark 7 times
Watermark 8 times
Watermark 9 times
Watermark 10 times

Go Back to Table of Contents