Tôi vừa đăng bài nói chuyện của mình tại Harvard GSD về tương lai của AI sáng tạo – chúng ta đang đi đâu và làm thế nào để khai thác nó:
Các chủ đề đã đề cập:
- Trí tuệ không gian: Photogrammetry, trường phát sáng thần kinh (NeRFs), và 3D Gaussian splatting để số hóa thực tế.
- Trí tuệ hình ảnh: Ước lượng tư thế được hỗ trợ bởi AI, phân đoạn, suy diễn độ sâu, và ánh sáng lại.
- Quy trình làm việc lai: Mã hóa cảm xúc, Giao thức Ngữ cảnh Mô hình (MCP), và cách mà LLM tương tác với Blender, Unreal, và Runway.
- Mô hình Nội dung đến Nội dung: Di chuyển từ văn bản sang video sang phương tiện cá nhân hóa hoàn toàn, động và theo thời gian thực.
- Tương lai của phương tiện: Podcast cá nhân hóa, tour AR, trò chơi AI sinh ra, và sự mờ nhạt giữa phần mềm với nội dung.
Vì nano banana có kiến thức thế giới của gemini, bạn chỉ cần tải lên các ảnh chụp màn hình của thế giới thực và yêu cầu nó chú thích cho bạn.
"bạn là một trình tạo trải nghiệm AR dựa trên vị trí. làm nổi bật [điểm thú vị] trong hình ảnh này và chú thích thông tin liên quan về nó."
nếu Apple trang bị một cảm biến nhiệt/ hồng ngoại trên iPhone, tôi sẽ mua ngay lập tức. Độ phân giải 640-1024px FLIR trên một chiếc điện thoại sẽ thật điên rồ.