Liệu AI có thể truyền cảm hứng cho áo len lạ lùng dịp nghỉ lễ tiếp theo của bạn?
Dù có vẻ lạ lẫm, nhưng sự tiến bộ gần đây trong học máy đã biến điều này trở thành khả thi. CALA, một “hệ điều hành cho thời trang” giúp nhà thiết kế vẽ phác họa, thử nghiệm và sản xuất sản phẩm mới, là dịch vụ đầu tiên triển khai giao diện lập trình ứng dụng (API) DALL-E của OpenAI. Công cụ AI mới được CALA phát triển đã được triển khai và miễn phí thử nghiệm.
“Trường hợp sử dụng là cho phép bất kỳ ai truyền đạt ý tưởng của mình mà không cần phải vẽ phác hoặc tạo ra mô hình 3D, bằng cách sử dụng DALL-E tạo ra ý tưởng dựa trên đầu vào văn bản,” Andrew Wyatt, đồng sáng lập kiêm CEO của CALA nói. “Đây là sự tiếp tục của việc giúp mọi người tiếp cận trong một ngành công nghiệp lịch sử đã rất kín đáo.”
DALL-E cho thời trang điện tử?
Được thành lập vào năm 2016, CALA là nền tảng thời trang dành cho nhà thiết kế muốn có một cách tiếp cận dễ dàng để biến ý tưởng thành sản phẩm hữu hình. Dịch vụ này được cung cấp thông qua trang web và ứng dụng di động.Có thể đăng ký và thử nghiệm nền tảng miễn phí – vì vậy tôi đã thử.
Nó rất tương tự như các công cụ tạo nghệ thuật AI như DALL-E 2 và Stable Diffusion nhưng được tùy chỉnh để phù hợp với nền tảng CALA. Thay vì nhập đầu vào văn bản trong một chuỗi dài, các nhà thiết kế được hướng dẫn chọn một kiểu cơ bản, chẳng hạn như áo len, áo blouse hoặc túi xách, từ một danh sách 25 lựa chọn. Các nhà thiết kế sau đó sử dụng AI tạo ra để sửa đổi kiểu dáng thông qua hai câu hỏi văn bản. Câu hỏi đầu tiên mô tả thiết kế dựa trên tính từ và chất liệu, trong khi câu hỏi thứ hai mô tả các chi tiết và tính năng mong muốn như cổ tay hoặc khóa kéo.
“Chúng tôi muốn ngăn trường hợp một người nào đó đến, nhập vào văn bản ‘áo sơ mi màu nâu’, và họ cảm thấy nó tệ,” Andrew Wyatt, CALA cho biết.
Wyatt tin rằng giao diện người dùng thay thế này sẽ giúp nhà thiết kế tập trung vào những đặc điển quan trọng và tránh những kết quả không tốt. “Những gì chúng tôi đang làm ở đây, chúng tôi xây dựng một giao diện người dùng dựa trên việc tạo ra câu hỏi văn bản thông minh. Mục tiêu của chúng tôi ở đây là giúp mọi người đạt được kết quả ý nghĩa càng nhanh càng tốt.” Wyatt hy vọng điều này sẽ giúp nhà thiết kế tránh những kết quả không mong muốn hoặc không thu hút. “Chúng tôi muốn ngăn trường hợp một người nào đó đến, nhập vào văn bản ‘áo sơ mi màu nâu’, và họ cảm thấy nó tệ.”
Tôi đã thấy kết quả của chiến thuật này trong việc làm sweater Halloween của riêng tôi. Thiết kế thời trang, thú thật, nằm ngoài vùng an toàn của tôi, nhưng tôi thấy công cụ này thân thiện. Toàn bộ quá trình, bao gồm thời gian chờ đợi kết quả hiển thị, chỉ mất dưới một phút. CALA đưa ra sáu kết quả mỗi lần, bất kỳ kết quả nào sau đó cũng có thể được chèn vào nền tảng thiết kế để phát triển thêm.
Công cụ AI tạo ra ý tưởng cho chiếc áo len Halloween lạ lẫm. Tôi thích cái của phía dưới bên trái. CALA
Việc triển khai của CALA không nên bị hiểu lầm là một công cụ thiết kế chỉ cần bấm một lần. Nhà thiết kế vẫn cần mang theo những kỹ năng của riêng mình và học cách sử dụng nền tảng CALA. Tuy nhiên, Wyatt hy vọng AI sẽ giảm đáng kể các rào cản nhập nhằng cho những nhà thiết kế mới và cung cấp cho những nhà thiết kế kỳ cựu một cách để vượt qua khó khăn sáng tạo.
“Chúng tôi muốn mọi người có thể lấy một ý tưởng và theo đuổi nó thông qua sự biến đổi từng biến đổi,” Wyatt cho biết. “Chúng tôi nghĩ rằng điều này sẽ giúp mọi người nghĩ ra các khái niệm khác nhau và điên rồ hơn.”
Sự dễ dàng sử dụng có thể thúc đẩy sự gia tăng của DALL-E
Công cụ CALA là sự triển khai công cộng đầu tiên của DALL-E API của OpenAI bởi bên thứ ba. Hiện tại, API không được cung cấp cho công chúng và chưa có ngày phát hành.
Đây không phải là lần đầu tiên OpenAI tham gia vào lĩnh vực này. GPT-3, mô hình ngôn ngữ sâu học của công ty, đã được phát hành như một API vào năm 2020 và nhanh chóng được các bên thứ ba áp dụng. Hiện nay, GPT-3 được sử dụng bởi hàng chục công ty và tổ chức, bao gồm Copysmith và MessageBird. Microsoft đã mua một giấy phép để sử dụng mô hình GPT-3 cho Microsoft Power Apps và Dịch vụ Azure OpenAI.
Luke Miller, quản lý sản phẩm tại OpenAI, cho biết công ty đã học được những bài học quý giá từ việc triển khai GPT-3. “Mỗi lần triển khai đều giúp chúng tôi hiểu rõ hơn về an toàn, kỹ thuật và cuối cùng, về cách công nghệ của chúng tôi có thể tạo ra giá trị trong thế giới thực,” Miller nói. “Kể từ khi phát hành GPT-3 API, chúng tôi đã đưa ra nhiều cải tiến cho hệ thống bảo vệ của mình. Ví dụ, chúng tôi đã công bố điểm kết thúc quản lý mới cập nhật vào tháng Tám và chúng tôi tiếp tục tìm cách cải thiện dịch vụ.”
Kinh nghiệm của CALA với DALL-E API cho thấy sự dễ dàng sử dụng sẽ là yếu tố quan trọng thúc đẩy sự áp dụng của API khi nó được công bố cho công chúng. Wyatt cho biết, các kỹ sư của công ty đã sử dụng API chỉ trong vài tuần.
“Chúng tôi đã tiến hành một số ý tưởng chi tiết cao mà chúng tôi đã gửi cho [OpenAI] để đánh giá khoảng tám tuần trước. Sau đó, quá trình xây dựng và tinh chỉnh tổng cộng không quá một tháng,” Wyatt cho biết. “Tôi có thể thấy đây sẽ là một tích hợp có ý nghĩa trong nhiều sản phẩm khác nhau.”
Thực tế, làn sóng công cụ dựa trên DALL-E đã bắt đầu. Shutterstock, một dịch vụ cung cấp ảnh, hình ảnh và video từ kho, dự định triển khai DALL-E API “trong những tháng tới”. Shutterstock kết hợp thông báo này với một khung việc bồi thường cho các nghệ sĩ trên nền tảng khi tác phẩm của họ được sử dụng để đào tạo các mô hình trí tuệ nhân tạo. Microsoft cũng đang đưa DALL-E vào Dịch vụ Azure OpenAI của mình, tuy nhiên, hiện tại, việc truy cập vẫn chỉ dành cho những người được mời.
“Chúng tôi luôn cho rằng tương lai, đặc biệt trong lĩnh vực thời trang, đang tiến về phía thiết kế được cung cấp bởi trí tuệ nhân tạo (AI) và sản xuất tự động,” Wyatt nói. “Chúng tôi chỉ nghĩ rằng điều này sẽ xảy ra trong tương lai, có thể 5 năm sau. Nhưng chỉ trong sáu tháng qua, khi nhìn vào sự tiến bộ … chúng tôi nghĩ rằng sẽ có sự đổi mới đáng kể trong vài năm tới.”