说到Gemini Cli,这玩意在我加入社区之前就在TG上经常看到,几个频道上反复刷屏,当时还不知道这玩意的功能,以为只是一个能在终端部署的ai,我印象中好早就有类似的应用了,也没在意,看到了就刷掉。
后面闲着没事干的时候,手头又正好有一台服务器,就想着装一个玩玩,看看为什么Github 上能有那么多Star,结果试了一下发现这玩意也太好用,爽用了两天,我手头3个账户每天都用到限制为止 ![]()
其实说起来我也是闲的,那天正好看到了这位大佬发的帖子
Deep Research,基于上个版本的完全重构 - 搞七捻三 - LINUX DO
就把这个项目下载下来部署了一下,说实话这个项目很好用,就是大佬刚刚开始写,功能都还比较基础,我是有点想法,但是想了想有些功能属于非必要项,随意和大佬提功能也是加大人家的工作量,还是自己用ai弄出来玩玩得了,这里说一下,大佬写的UI是真好看 ![]()
想了想就用Gemini试了试效果,把我的想法和gemini 说了下,(其实一开始只是我在部署的时候有一点问题,这个项目默认是只能本地访问的,当时我部署完了之后在浏览器上死活打不开页面,防火墙也放行了,就觉得很奇怪,然后就问了一下gemini,结果Gemini一下就把问题找出来了,所以我想着试试gemini能不能对项目进行一下改造,让我也过一把项目经理的瘾)
我一开始先是小试牛刀,让gemini试着为这个页面加一个鉴权功能,因为我开启了公网访问,如果没有鉴权的话容易被爆破,只用了一次对话,gemini就生成了一个简单的鉴权页面(可惜我这里没截图)这个页面只有一个输入框和确认,在.env文件里可以设置token,用来鉴权,gemini不仅是完成了任务,而且界面的样式也是和大佬写的UI风格一致,当时就感觉gemini是真的牛(当然,更牛的是写出这个UI的大佬)
第一次就成功了,让我也挺兴奋的,我看了下整个页面都是英文的,想了想让gemini为整个项目进行了多语言化的改造,先生成一个中文的看看效果,也是只花了一个对话就实现了
当然,第一次实现的效果是一个切换按钮,和旁边的明暗切换是一样的,点击一下就在中英文切换,但是我想了想既然是多语言化,后面要加多个语言的话,只用切换按钮肯定是不够用,就让它改成了下拉菜单样式,不过大佬的UI里面可能是没写下拉菜单,所以gemini第一次生成的下拉菜单很丑,连圆角都没有,我让跟他描述了我想要的效果,让它根据大佬写的liquid glass和glasscard来优化了整个下拉菜单的样式,经过两三次对话也就实现了现在的这个效果。
这里提一嘴,因为我是免费用户,所以经常用着用着api就爆了,切换api之后前面的对话又都忘光了,而且有时候用的好好的gemini忽然就断连了,整个终端都要重连,不知道是我服务器的问题还是gemini的问题,搞得有时候一个要求我要反复和gemini沟通,每次都得让gemini先了解一下项目和我要做的事,浪费了不少api额度。
在多语言完成之后,我想着让gemini也加个背景的功能,我记得当时大概是这么和Gemini说的
“我要你帮我实现背景切换的功能,要有两个选项,一个是从链接设置图片,一个是从本地选择图片”
(当时还没让它帮我实现图片不透明度和模糊的效果)
也是只花了一次对话就实现了,不过后面我发现一个问题,就是图片选择的按钮始终老是显示不出来,需要我鼠标点击之后才能出现这个控件,这个问题搞了我很久。
因为我本身不会写代码,所有的功能都是gemini实现的,我只会提要求和反馈问题并给gemini报错的信息和日志,所有我是不知道这个问题大概是什么原因导致的,就导致我跟gemin沟通的过程中说了很多无效的反馈,最后还是我发现当我使用链接来设置背景,而不是本地图片来设置背景的时候就不会有这个问题。
我把这个情况跟gemini一说,它立马就指出了问题所在,可惜这里我也没截图,大概就是当我使用链接设置背景图片时,这段链接的长度最多可能就几百个字符串,而我使用本地图片时,图片base64编码可能有几M那么长,这么长的文本直接显示在一个框里面就会出问题,后面我和gemini 说了个解决方法,如果是使用的链接设置背景,那么就显示完整的链接,如果使用本地图片设置背景,那就只显示图片的文件名,完整的路径存放到另一个文件里,也是顺利的解决了这个问题(这个问题花了我很多次对话,用了一个账户的api每日限额)。
给大家看看最后的效果图
其实还是有点小问题的,比如多语言化没到位,上传图片的按钮和图片链接框里的文字不会随语言选项变化,这种问题gemini基本都是一个对话就能解决,可惜我3个账户的api都限额了,今天是搞不定了(这时候就体现出会写代码的重要性了,各位大佬几分钟就能解决的事我得拖一天)
玩到这里之后,又有了点新想法,前面都是一些比较简单的页面功能修改,如果我让gemini做个用户系统(涉及到前后端,数据库),Gemini还能完成吗?
我就跟Gemini提出了要有账户系统的功能,(我的api额度全花在这上面了)
其中有很多波折,一开始的账户系统随便来个人就能注册使用,我就和Gemini说搞个邀请码系统,有邀请码才能注册,想了想光有邀请码似乎效果也不好,又让gemini给我写了个很简陋的管理员系统,管理员可以生成邀请码,可以删除用户,就这几个简单的功能,我花了两天时间才让gemini改成一个我满意的效果,大部分时间都是花在修bug上,特别是前后端通信这一块,小部分是细节微调,而功能框架,这玩意gemini一次对话就完成了。。
大概聊到这里,希望各位大佬不要笑话我,连代码都看不懂拿着ai乱改别人的项目 ![]()
其实在一几年刚接触到Github,刚接触到开源的时候,见识到了这么多优秀的项目,有时候真的很想提出一点自己的建议,可是我也不会写代码,有时候总是有一些不切实际的想法,不知道这些想法实现的难度,就贸然的像开发者提出,造成别人的困扰,那时候我就在想要是自己也会编程就好了,有什么想法就能自己去实现了,一直到现在,虽然我还是不会编程,还是看不懂代码,但是借助ai我可以开始慢慢的去实现我的一些想法,真的很感慨现在ai的发展速度,也许再过上几年,我就可以利用ai从零开始实现一个项目了吧!
后续我还想试试让gemini为每个用户写上一个api配置选项,让每个用户都可以使用自己的api来进行深度研究,然后完善一下移动端的界面,并加入一个历史记录,可以记录每次的研究结果,再丰富一下用户的设置页面,然后把这玩意打包成docker镜像,感觉会很有趣。(也不知道这么多功能gemini能不能实现)
这里放一点展示图


















