近日,多名配音演員公開(kāi)發(fā)聲,反對(duì)擅自采集其聲音素材用于A(yíng)I訓(xùn)練、音色合成及商業(yè)變現(xiàn)的行為,自然人聲音權(quán)益保護(hù)問(wèn)題由此進(jìn)入公眾視線(xiàn)。事實(shí)上,利用人工智能技術(shù)克隆他人聲音的侵權(quán)行為及引發(fā)的糾紛并非新鮮事。2024年4月,北京互聯(lián)網(wǎng)法院就審結(jié)了全國(guó)首例“AI聲音侵權(quán)案”。該院判決認(rèn)定,被告未經(jīng)合法授權(quán)即使用原告聲音、開(kāi)發(fā)案涉AI文本轉(zhuǎn)語(yǔ)音產(chǎn)品,構(gòu)成侵權(quán),賠償原告各項(xiàng)損失25萬(wàn)元并書(shū)面賠禮道歉。
在前人工智能時(shí)代,傳統(tǒng)的錄音技術(shù)只是將已有的聲音固定到一定的物質(zhì)載體上以備重現(xiàn)。但隨著人工智能技術(shù)的快速發(fā)展,如今利用聲音數(shù)據(jù)和深度學(xué)習(xí)模型,便可以對(duì)聲音特征進(jìn)行建模與學(xué)習(xí),從而進(jìn)行聲音克隆、語(yǔ)音轉(zhuǎn)換等AI聲音處理活動(dòng)。其中,聲音克隆屬于深度合成技術(shù)的一種,其通過(guò)對(duì)特定自然人的語(yǔ)音數(shù)據(jù)進(jìn)行深度學(xué)習(xí),訓(xùn)練出相應(yīng)的人工智能模型,進(jìn)而生成與該特定自然人聲音高度相似的語(yǔ)音內(nèi)容。這項(xiàng)技術(shù)的核心,在于對(duì)人的聲音特征進(jìn)行建模與再現(xiàn)。如果未經(jīng)本人同意或無(wú)法定事由,克隆生成與其聲音高度相似的聲音,就會(huì)侵害其聲音權(quán)益。依據(jù)我國(guó)民法典、個(gè)人信息保護(hù)法等法律,自然人的聲音可以通過(guò)肖像權(quán)、個(gè)人信息權(quán)益加以保護(hù);在某些情形下,還可以通過(guò)著作權(quán)法以及反不正當(dāng)競(jìng)爭(zhēng)法加以保護(hù)。
依據(jù)民法典,自然人的聲音權(quán)益可參照適用肖像權(quán)保護(hù)的規(guī)定。由于每個(gè)自然人在音色特征、發(fā)音習(xí)慣、語(yǔ)速節(jié)奏、聲音質(zhì)感等方面都有所不同,因此聲音作為個(gè)人的生理標(biāo)識(shí),與肖像一樣,可以用于識(shí)別特定的自然人。例如,一些著名藝術(shù)家、演員的聲音就為社會(huì)大眾所熟悉。雖然我國(guó)法律沒(méi)有將聲音權(quán)規(guī)定為一項(xiàng)具體的人格權(quán),但為防止他人隨意復(fù)制、模仿、偽造特定自然人的聲音,損害自然人的人格尊嚴(yán)和財(cái)產(chǎn)利益,民法典第1023條第2款明確規(guī)定,“對(duì)自然人聲音的保護(hù),參照適用肖像權(quán)保護(hù)的有關(guān)規(guī)定”。也就是說(shuō),民法典中關(guān)于禁止他人擅自制作、使用、公開(kāi)肖像權(quán)人肖像的規(guī)定,關(guān)于肖像合理使用的規(guī)定,以及關(guān)于肖像許可使用合同的規(guī)定,都可參照用于對(duì)自然人聲音權(quán)益的保護(hù)。
同時(shí),還可根據(jù)個(gè)人信息保護(hù)法對(duì)自然人的聲音加以保護(hù)。自然人的聲音屬于個(gè)人信息。通過(guò)技術(shù)手段從聲音中提取的、能夠反映特定個(gè)體聲音特征的聲學(xué)特征模式(聲紋),屬于自然人的生物識(shí)別信息,是敏感個(gè)人信息。依據(jù)個(gè)人信息保護(hù)法,自然人對(duì)其個(gè)人信息的處理享有知情權(quán)和決定權(quán),有權(quán)限制或拒絕他人處理,除非法律、行政法規(guī)另有規(guī)定。因此,任何人要利用自然人的聲音來(lái)訓(xùn)練人工智能語(yǔ)音產(chǎn)品或者克隆其聲音,都必須取得該自然人的單獨(dú)同意或具備法定事由。否則,聲音被他人非法處理的自然人,有權(quán)以侵害個(gè)人信息權(quán)益為由提起訴訟。
實(shí)踐中,自然人是通過(guò)肖像權(quán)還是個(gè)人信息權(quán)益來(lái)保護(hù)聲音權(quán)益,區(qū)別主要在兩個(gè)方面。一是可識(shí)別性的認(rèn)定標(biāo)準(zhǔn)。如果原告以侵害肖像權(quán)為由起訴非法進(jìn)行聲音克隆的行為人,就必須判斷通過(guò)人工智能生成的聲音能否識(shí)別出原告本人。司法實(shí)踐中,被告往往會(huì)抗辯稱(chēng),案涉聲音經(jīng)AI處理,不具有可識(shí)別性,社會(huì)公眾難以?xún)H憑聲音識(shí)別出原告聲音。而對(duì)于克隆后的聲音是否具有可識(shí)別性,應(yīng)當(dāng)以社會(huì)一般人聽(tīng)到該聲音后能否識(shí)別出特定自然人為標(biāo)準(zhǔn)。社會(huì)一般人的具體范圍,需結(jié)合聲音主體的社會(huì)知名度等因素來(lái)確定。如果原告以侵害個(gè)人信息權(quán)益為由起訴,那么在認(rèn)定被告所處理的聲音信息是否屬于個(gè)人信息時(shí),可采取技術(shù)判斷標(biāo)準(zhǔn)。換句話(huà)說(shuō),即便社會(huì)一般人通過(guò)聽(tīng)覺(jué)無(wú)法識(shí)別出特定自然人,但只要通過(guò)聲紋比對(duì)等技術(shù)手段能確定是原告的聲音,就應(yīng)當(dāng)認(rèn)定該聲音為原告的個(gè)人信息,被告的行為構(gòu)成侵權(quán)。
二是侵權(quán)賠償責(zé)任的歸責(zé)原則。原告參照肖像權(quán)保護(hù)的規(guī)定起訴,適用的是民法典第1165條第1款規(guī)定的過(guò)錯(cuò)責(zé)任原則,即原告需要證明被告在克隆或使用聲音時(shí)存在主觀(guān)上的過(guò)錯(cuò)。而如果以侵害個(gè)人信息權(quán)益起訴,考慮到個(gè)人信息處理者與個(gè)人之間技術(shù)能力等方面的不對(duì)等,適用的是個(gè)人信息保護(hù)法第69條第1款規(guī)定的過(guò)錯(cuò)推定責(zé)任,即由個(gè)人信息處理者證明自己沒(méi)有過(guò)錯(cuò),而非由個(gè)人證明處理者有過(guò)錯(cuò)。
(作者系清華大學(xué)法學(xué)院教授、個(gè)人信息保護(hù)與數(shù)據(jù)權(quán)利研究中心主任)
編輯:李華山