
-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于事件的唇讀技術及三平面融合網絡(Event-based Lip Reading with Triplane Fusion Network)
《ACM Transactions on Multimedia Computing, Communications, and Applications》:Event-based Lip Reading with Triplane Fusion Network
【字體: 大 中 小 】 時間:2026年02月27日 來源:ACM Transactions on Multimedia Computing, Communications, and Applications
編輯推薦:
事件相機唇語識別通過三視角融合提升性能。提出TF-Net框架,利用XYT、XT、YT三種互補視角,結合專家模塊與跨視角互信息交換機制,有效捕捉唇部運動特征,在DVS-Lip和Modality數據集上分別提升1.6%和2.3%準確率。
該摘要是使用自動化工具生成的,并非由文章作者撰寫或審核。它旨在幫助發現、評估相關性,并幫助來自相關研究領域的讀者理解本文的工作。它旨在補充作者提供的摘要,后者仍是文章的官方摘要。完整文章才是權威版本。點擊此處了解更多。
點擊此處對摘要的準確性、清晰度和實用性進行評論。您的反饋將有助于改進和未來版本的優化。
要查看此由AI生成的通俗語言摘要,您必須具有高級訪問權限。
生物通微信公眾號
知名企業招聘