View Single Post
Old 12-08-2011   #1
tonny_thuong
R10 Vô Địch Thiên Hạ
 
tonny_thuong's Avatar
 
Join Date: Feb 2008
Posts: 61,375
Thanks: 0
Thanked 0 Times in 0 Posts
Mentioned: 0 Post(s)
Tagged: 0 Thread(s)
Quoted: 0 Post(s)
Rep Power: 79
tonny_thuong Reputation Uy Tín Level 1tonny_thuong Reputation Uy Tín Level 1tonny_thuong Reputation Uy Tín Level 1
Default T́m kiếm địa điểm bằng giọng nói tiếng Việt trên iPhone

T́m kiếm địa điểm bằng giọng nói tiếng Việt trên iPhone

Ứng dụng iSago dùng công nghệ nhận dạng và tổng hợp tiếng nói tiếng Việt giúp người dùng tương tác với điện thoại iPhone để t́m thông tin về ẩm thực, giải trí tại TP HCM.

iSago là thành quả nghiên cứu trong 3 năm của pḥng thí nghiệm AILab thuộc Đại học Khoa học Tự nhiên TP HCM. Ở phiên bản 1.0, iSago cung cấp chức năng t́m kiếm thông tin nhà hàng, quán bar, cafe, địa điểm giải trí trên địa bàn TP.HCM.

Clip t́m thông tin bằng iSago




Giao diện ứng dụng iSago trên điện thoại iPhone. Ảnh: Hà Mai.

Sau khi cài iSago vào iPhone, người dùng có thể đặt câu hỏi bằng giọng nói như “Tôi muốn t́m quán cafe ở quận 1” hay “Tôi muốn ăn phở tại quận 1”... iSago sẽ truyền nội dung truy vấn này về server để xử lư và gửi lại kết quả t́m kiếm.


Quy tŕnh hoạt động t́m kiếm thông tin bằng giọng nói của ứng dụng iSago.

Kết quả là một danh sách tên nhà hàng, địa chỉ. Khi nhấn vào danh sách th́ địa điểm cần t́m sẽ được hiển thị trên bản đồ hoặc người dùng có thể nghe đọc địa chỉ trực tiếp bằng công nghệ tổng hợp giọng nói. Trong trường hợp không có kết nối mạng, người dùng vẫn có thể t́m kiếm trên điện thoại iPhone bằng những câu truy vấn văn bản nhập vào từ bàn phím.


Quy tŕnh hoạt động hệ thống VIS (Viet voIce System).

Pḥng thí nghiệm AILab cũng giới thiệu hệ thống VIS (Viet voIce System) hỗ trợ hỏi đáp thông tin bằng tiếng Việt qua đường điện thoại, sử dụng công nghệ nhận dạng và tổng hợp tiếng nói tiếng Việt với độ chính xác cao và tốc độ xử lư nhanh.


Khi có người gọi điện đến, hệ thống sẽ phân tích giọng nói để chuyển máy đến người cần gặp. Ảnh: à Mai.

VIS phiên bản đầu tiên bao gồm một số dịch vụ trong đó nổi bật nhất là dịch vụ tự động chuyển cuộc gọi VISIR. Với VISIR người dùng có thể nói tên các pḥng, ban trong một trường đại học sau đó hệ thống sẽ tự động chuyển cuộc gọi đến các pḥng, ban tương ứng mà không phải t́m kiếm số điện thoại trong danh bạ hoặc chờ đợi tiếp tân nối máy.

Clip hệ thống VISIR nhận dạng giọng nói



Hà Mai
theo vne
tonny_thuong_is_offline  
Attached Thumbnails
Click image for larger version

Name:	iSago.JPG
Views:	7
Size:	157.6 KB
ID:	340669  
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
 
Page generated in 0.04324 seconds with 10 queries