豆丁網文庫與it168資訊


本站AI自動判斷提供您所需要的app下載:點我下載安裝,你懂的APP

之前吳賓寫過一個類似項目,

(第277篇)吳賓:副業小項目之百度文庫上傳文檔

這個項目雖是百度文庫的,

但是項目原理卻是相通的:

通過平臺上傳付費整理好的付費文檔,

有人需要則通過平臺付費下載或者付費看完整版。

這次我們講的平臺是豆丁網,

豆丁網一直是對標百度文庫的,

而且能作為第三方平臺活這么久肯定有其道理的。

首先我們注冊賬號,然后申請認證,

只有認證后上傳才能有收益,

認證也比較簡單,只需要你上傳一篇文檔就可以了。

認證之后就需要搬運文檔了,

這里有點需要特別注意,

就是你不要啥都搬運,

而是只挑熱門類目的文檔搬運,

比方說,大學畢業季時的簡歷、論文、考研資料等,

只有熱門文檔才能賺到錢,

小眾冷門文檔誰看啊,

沒人看自然就沒人付費就賺不到錢啊。

當然這個項目也算是搬磚項目,

所有的搬磚項目核心都在以量取勝,

只要上傳的足夠多,總有文檔會爆,

爆了就很容易出爆款幾天賺幾個月的錢,

也有可能你發的文檔現在現在沒啥人看,

在未來某個階段因為某些關鍵詞就火了,

所以關鍵還是需要瘋狂把量堆起來。

關于文檔來源之前吳賓文章也寫了,

某魚、某多多、某寶幾塊錢就能買到,

有些文檔可能平臺已經有人上傳過了,

這時候也可以自己偽原創,

最簡單的偽原創就是用自己的話復述一遍,

只要上傳上去平臺沒有查到重復的就算上傳成功,

如果查重后重復的字數比較多的話可以直接放棄,

如果查重后重復的字數比較少的話再簡單修改后上傳即可,

一般選擇3-5頁的文檔上傳,修改也簡單,過審率也高。

文檔上傳需要注意文檔標題,

標題最好是文檔內容的總結,

當然也要注意關鍵詞布局,

這個小項目也需要內容精細化運營,

如果別人搜關鍵詞找到你的文檔,

而你的文檔內容質量也非常優質的話,

下載量就會很可觀,

自然而然收益也很可觀。

除了默認的官方收益,

還有一種非常雞賊的方式,

那就是在文檔的頁眉頁腳處留自己的聯系方式,

這是一種常用的把用戶引流到私域的方式,

等用戶到了私域,就可以賣資料,賣vip啥的......

本文將圍繞國產數據庫領域生態方面進行思考,從社區支持、生存空間、生態建設等幾方面展開細說。

作者 | 祁國輝

策劃 | 韓 楠

根據國內權威信通院云大所發布的數據庫發展研究報告表明,隨著數字經濟發展,全球數據庫產業持續火熱,從21世紀開始,全球共有472家企業提供數據庫產品服務。我國數據庫產業從2013年開始呈現高速發展態勢,平均每年新增10家左右數據庫企業[1]。

國際著名數據庫社區 DB-engine的Ranking6月排名,前十名,都不是國產數據庫[2]。所以目前國內數據庫的競爭態勢可謂是,蓬勃發展, 相愛相殺。

前階段,就中美數據庫研發市場對比有一篇相關分享,此間引起諸多業界人士的多維度探討。其中分享者吳英俊也談及了生態這一話題, 但是淺嘗輒止,今天我嘗試狗尾續貂,再和各位看官聊一聊。

生態,是一個生物學概念, 一個完善的生態系統,包含生產者,消費者,底層的生產者為頂層的消費者提供營養。從而實現互相依存,自給自足。

圖源:百度

那我們來看看在國產數據庫領域生態方面的思考,以下將分別從社區支持、生存空間等幾個方面來說說。

生態之社區支持

開源社區的精神在于取之于開源, 奉獻于開源, 眾人拾柴火焰高, 不過在數據庫這個領域有時候不太一樣。

在數據庫主版本一路先前更新迭代的時候, 大多數企業實際上無力去承擔數據庫升級合并的成本, 另外一些基于自身用戶需求做的一些功能增強和迭代也和社區主版本越行越遠, 最終就變成主版本已經更新迭代很多代了, 自己的核心還停留在上個世紀, 這一點在PG社區中尤為明顯。

2022年10月, PG發布了PG15,但是不少國內的基于PG的自研數據庫,已經沒有辦法再去merge最新的PG15的代碼。比如PolarDB for PG, 和PG的差距越來越大,最終在2021年5月決定開源PolarDB for PG這個版本。

在這種情況下, 用戶選擇的時候就必須要慎重一點, 雖然祖上都是同源, 但是在后期演變中已經開枝散葉,有了非常大的差異。而用戶在選擇社區的時候, 基于生態,最多需要考慮以下幾點:

人員好不好找:MySQL和PG目前大行其道, 無論開發人員還是運維人員都比較容易找, 但是一些上古的數據庫,比如DB2,sybase等等, 就已經很難找到性價比高的技術人員了。之前的DBA要么已經脫離戰場很久, 而還在戰場馳騁的都肯定是資深的專家, 出場費用不菲。

資料好不好找:國內數據庫往往在文檔資料上存在短板, 一個產品出來, 很多技術文檔基本都是空白,或者寥寥數字,言簡意賅,這就對于用戶深入學習,甚至解決問題帶來巨大困難, 這時候同源其他數據庫的技術問題解決很可能就能有所借鑒。

問題好不好處理:Oracle 經過40年的發展, 全球千萬級別的用戶打磨, 基本上可以說碰到新問題的幾率已經很小, 但是對于國產數據庫而言, 缺乏大量用戶長時間的打磨, 出現問題的幾率就很高, 那么出現問題怎么快速解決, 社區支持也可以起到很大的作用。

好不好遷移:國產數據庫方興未艾, 誰都難以預測, 5-10年之后,大浪淘沙之后, 還有誰能傲立潮頭。未慮勝, 先慮敗, 數據庫作為企業核心, 來不得馬虎,萬一出現極端情況, 同源的產品替代應該是難度最低的, 這個也是考慮的一個方面。

生態之生存空間

大數據技術標準推進委員會日前發布的《數據庫發展研究報告(2023年)》顯示,隨著數字化轉型深入推進,千行百業應用對數據庫的需求變化推動數據庫技術加速創新,全球數據庫產業快速發展,我國已經邁入第一梯隊。預計到2027年,中國數據庫市場總規模將達到1286.8億元,市場年復合增長率(CAGR)為26.1%。

但是在生態中, 還存在一個平衡的概念, 平衡的意思很簡單, 俗話說得好, 一山不容二虎, 其深層次的原因, 在于生態鏈上, 一個山頭的體量, 無法支撐兩個生態鏈頂端的動物,僅能支撐一只老虎生存。同理在目前國內數據庫市場上, 這個市場體量, 到底容納多少個數據庫能夠健康發展?

樂觀地來看, 據信通院統計, 國內市場總規模是1286.8億元, 但是這個叫做可觸達市場, 是樂觀考慮, 從最終用戶方考慮, 國產數據庫百舸爭流, 誰都不知道最后有多少能到達終點, 所以用戶在替換的時候, 就變成Oracle 不買, 國產數據庫淺嘗輒止, 這個市場規模有可能是個可望而不可及的數字。

另一個角度出發, 對待國產數據庫, 并不應該用國產就應該便宜,國產數據發展本就充滿坎坷, 如果另一方面,用戶通過白嫖盜版等手段,進一步擠壓國產數據庫的生存空間, 那么國產數據庫的生態環境就變得更加惡劣了。

競爭過于激烈的時候, 我們就細分賽道, 定義出一個局部占優的場景, 把競爭對手拉到對方不擅長的場景中, 從而取得最終的勝利, 目前國內數據庫發展也是按照這個防線在快速演變。按照信通院2023年的數據庫行業產業圖譜, 數據庫產品主要分為集中式事務型數據庫, 分布式事務型數據庫,分布式分析型數據庫,時序數據庫,鍵值型內存數據庫,圖數據庫, 搜索型數據庫,時空數據庫, 加上最近兩年的HTAP數據庫和向量數據庫, 已經把數據庫市場分為不同的幾個場景,如下圖所示:

今天看到一個群里有人講了一個段子,讓人印象頗深:

一個中國人在沙漠里面開了一個加油站,生意不錯,然后一堆中國人也跑來開加油站,結果,大家全部倒閉了;一個猶太人在沙漠里開了一個加油站,第二個猶太人開了一個餐館,第三個猶太人開了一家旅店,最后這里變成了一個繁華小鎮。

一個完整的生態環境,應該是一個平衡的環境, 構成一個完整的生態鏈, 并且能夠自給自足, 目前國內的生態環境, 應該還需要進一步進化。如果任由市場野蠻生長, 最終必然會有勝出, 但是這個時間會造成相當長的一段混亂時期。

有媒體采訪了MySQL之父 Monty,他認為,歐洲和美國也差不多, 充斥著大量的數據庫產品,一直都這樣,單大多數產品無法成功。

問題在于, 如果一家大企業決定開發數據庫 , 那他們肯定要努力打造一款五年、十年甚至二十年后仍然還存在的產品。MySQL 就是這樣, Maria 也因為有基金會的支持, 而其他數據庫, 因為缺乏這樣的根基, 所以這200種產品種有99% 會在未來五年內徹底消失, 畢竟數據庫市場還沒有大到能夠容納得下所有。

其他生態建設相關

數據庫不是獨立存在的, 一方面最終用戶使用數據庫, 必然伴隨著應用系統,中間件, 操作系統,硬件平臺等上下游產品;另一方面在整個數據庫的銷售鏈條當中也涉及分銷商,增值渠道商,獨立軟件開發商, 系統集成商,數據庫運維合作伙伴一系列的商業鏈條。

另外從技術體系角度來看, 也面臨著基礎技術生態(C++, Rust),應用技術生態(Raft,LSM),監控運營生態(Grafana,Prometheus)等等。

從學術上來看, 又要考慮高校合作(頂會期刊與成果轉化),獨立應用開發商合作, 周邊生態產品合作(管理工具, 調優工具, 報表工具, SQL工具)。

俗話說得好, 一個好漢三個幫, 生態建設之路的核心一方面在于取長補短,共同搭建完整解決方案, 另一方面也在于搭建足夠的戰略縱深,在生態競爭中獲得更大的優勢。

對用戶來講, 這方面的考察主要體現在如下幾條:

兼容性:是否兼容主流的標準,主流的開發工具和報表工具;

合作伙伴:是否有足夠多的合作伙伴, 已經基于該產品進行了二次開發或者加工, 有多少基于該產品的解決方案;

投資方生態:目前由于XC要求, 部分企業對于數據庫廠商的持股方也有要求, 要求達到完全的自主可控。這個也算是一個附加條件;

案例多不多:踩著別人的腳印, 不容易踩到便便, 這個我想大家都懂。

以上是對生態的一些淺見, 同時談生態免不了溯源, 這一部分是老生常談了, 以下就加以整理,作為附錄放在后面。

附錄一 :溯源

目前國產數據庫琳瑯滿目, 但是萬變不離其宗, 有一大部分都是可以和DBRanking前十名搭上關系,基本上可以劃分為這樣幾個大的陣營。

OLTP數據庫市場分布圖

Oracle 兼容

這個領域的主要選手是武漢達夢, 以及浪潮的K-DB數據庫, 仔細看產品的功能和特性, 基本上復刻了Oracle的功能和技術數據, 如RAC 這樣的核心技術。目前達夢作為國內老牌信創數據庫, 正在信創道路上高歌猛進。

MySQL兼容

MySQL作為全球排名第一的開源數據庫, 成立于1979年, 創始人是Monty Widenius,2008年被Sun 公司收購, 2009年Sunday公司被Oracle收購, 所以現在Oracle作為數據庫市場的巨無霸, 手持商業數據庫Oracle和開源數據庫MySQL。

作為開源數據庫, 是國產數據庫最佳的學習和借力對象, 代表有國內MySQL發現版萬里開源GreatSQL , 也有互聯網大廠的阿里RDS, 阿里polar DB mysql版, 騰訊TDSQL,中國電信的TeleDB MySQL。最近比較上升比較快的GodenDB 也是基于MySQL開發的。

PG兼容

另外,開源界的另外一顆新星也備受大眾喜愛, 這就是PostgreSQL,最近幾年上升速度特別快, 有望超越MySQL成為排名第一的開源數據庫, 究其原因:

一方面是MySQL存在數據量上面的瓶頸,Oracle和MySQL的差異化定位也一定程度上制約了MySQL的發展;

另一方面就是MySQL的GPL開源協議,如有第三方改源碼,也必須開源,而且不允許作為閉源的商業軟件發布和銷售,但可以買訂閱服務。使得國內數據庫廠商望而生畏, 所以越來越多人選擇了PG的BSD協議。典型的比如巨杉數據庫, 以及Pigsty,騰訊TBase。

另外不得不說其中一個變體, 就是Open Gauss體系, 源自PG 9系列, 但是在經過一系列操作之后, 現在也作為一個獨立的生態體系存在, 和open系列一樣, 自主可控了, 目前國內有不少數據庫也轉投Open Gauss陣營, 比如人大金倉、海量、MogDB、瀚高等等。

Informix兼容

2015 年,IBM 對中國公司銷售 Informix 源代碼,與 IBM 簽訂源代碼授權的公司有華勝天成、南大通用和星瑞格。這三個公司成為以引進 Informix 源代碼發展國產數據庫的代表。

自研分布式

最近幾年, 基于LSM樹的數據庫,因為其優秀的寫友好以及高并發, 得到不少分布式數據庫的青睞, 典型的就是TiDB和OceanBase, 都是基于LSM-Tree的存儲實現, 同時結合Paxos 或者Raft協議實現分布式的高可用, 在一定程度上打破了X86單機的上限, 可以通過橫向擴展來支持海量數據存儲以及海量的并發讀寫。目前在墨天輪上上升速度很快。

SequoiaDB 巨杉數據庫是一款金融級分布式數據庫,主要面對高并發實時處理型場景提供高性能、可靠穩定以及無限水平擴展的數據庫服務。用戶可以在 SequoiaDB 巨杉數據庫中創建多種類型的數據庫實例,以滿足上層不同應用程序各自的需求。SequoiaDB 巨杉數據庫支持 MySQL、MariaDB、PostgreSQL 和 SparkSQL 四種關系型數據庫實例、JSON 文檔類數據庫實例,以及 S3 對象存儲的非結構化數據實例。

附錄二:開源協議

因為目前有不少國產數據庫都基于某種開源軟件, 那么比較嚴格的GPL和寬松的BSD協議,就會有很大的不同, 之前有人說,為什么國內PG生態的多, 就是應為GPL的傳染性太強, 而PG的協議就寬松得多,下面我們也針對這幾種協議簡單做個歸納匯總。

◆ 主流開源協議

BSD協議

BSD開源協議是一個給予使用者很大自由的協議。基本上使用者沒有任何限制,可以自由的使用,修改源代碼,也可以將修改后的代碼作為開源或者專有軟件再發布。

如果再發布的產品中包含源代碼,那么在源代碼中必須帶有原來代碼中的BSD協議。如果再次發布的只是二進制類庫/軟件,則只需要在類庫/軟件的文檔和版權聲明中包含原來代碼中的BSD協議。

不可以用開源代碼的作者/機構名字和原來產品的名字做市場推廣。

BSD代碼鼓勵代碼共享,但需要尊重代碼作者的著作權。BSD由于允許使用者修改和重新發布代碼,也允許使用或在BSD代碼上開發商業軟件發布和銷售,因此是對商業集成很友好的協議。而很多的國內數據庫公司企業在選用開源產品的時候都首選BSD協議,因為可以完全控制這些第三方的代碼,在必要的時候可以修改或者二次開發。這樣就有了更大的自主控制權。

Apache協議

Apache Licence是著名的非盈利開源組織Apache采用的協議。該協議和BSD類似,同樣鼓勵代碼共享和最終原作者的著作權,同樣允許源代碼修改和再發布。但是也需要遵循以下條件:

需要給代碼的用戶一份Apache Licence。

如果修改了代碼,需要在被修改的文件中加以說明。

在衍生的代碼中(修改和有源代碼衍生的代碼中)需要帶有原來代碼中的協議、商標、專利聲明和其他原來作者規定需要包含的說明。

如果再發布的產品中包含一個Notice文件,則在Notice文件中需要帶有Apache Licence。你可以再Notice中增加自己的許可,但是不可以表現為對Apache Licence構成更改。

Apache Licence也是對商業應用友好的許可。使用者也可以再需要的時候修改代碼來滿足并作為開源或商業產品發布/銷售。

該協議的優勢在于:

永久權利。一旦被授權,永久擁有。

全球范圍的權利。在一個國家獲得授權,適用于所有國家。假如你在美國,許可是從印度授權的,也沒有問題。

授權免費。無版稅, 前期、后期均無任何費用。

授權無排他性。任何人都可以獲得授權

授權不可撤消。一旦獲得授權,沒有任何人可以取消。比如,你基于該產品代碼開發了衍生產品,你不用擔心會在某一天被禁止使用該代碼,這對于面對不可預知的世界環境尤為重要。

GPL協議

GPL 全稱是 GNU General Public License協議,其核心是只要在一個軟件中使用(“使用”包括對類庫引用,修改后的代碼以及衍生代碼)GPL協議的產品,則該軟件產品必須也采用GPL協議,既必須也是開源和免費。

這就是所謂的GPL協議“傳染性”。對于使用GPL協議的開源代碼,商業軟件或者開發人員對代碼進行集成以及作為類庫進行二次開發,在進行再發布的時候需要伴隨GPL協議。

GPL 有兩個屬性廣受關注,那就是:可修改和可盈利。

1. 可自由修改

如果你想添加或刪除某個功能 或者 在別的項目中使用部分代碼,沒問題,唯一的要求是,使用了這段代碼的項目也必須使用 GPL 協議。

2. 可用來盈利

你可以在分發軟件的時候收費,但必須在收費前,向你的客戶提供該軟件的 GNU GPL 許可協議,以便讓他們知道,他們可以從別的渠道免費得到這份軟件,以及你收費的理由。

木蘭協議

木蘭系列許可證包含“木蘭寬松許可證”和“木蘭公共許可證”(后續可能還有更多),均由北京大學作為牽頭單位,依托全國信標委云計算標準工作組和中國開源云聯盟,聯合開源生態圈產學研優勢團隊和個體、尤其是開源法務和律師,起草、修訂并發布。

木蘭開源許可證第一個版本于 2019年8月5日發布,第二版本于 2020年1月發布。

2020年 2 月 14 日,開源促進會(OSI,Open Source Initiative)批準了來自中國的木蘭開源許可證第二版(Mulan PSL v2),木蘭許可正式成為一個國際化開源軟件許可證(或稱“協議”)。

BSD、MIT 類寬松許可證兼容 Mulan PSL v2 許可證;Mulan PSL v2 兼容 Apache License v2.0、L/GPLv2、L/GPLv3 等許可證。即,許可在 BSD、MIT 類許可證下的代碼可以貢獻到 Mulan PSL v2的項目中,許可在 Mulan PSL v2 下的代碼可以貢獻到 Apache License V2.0、L/GPLv2 或 L/GPLv3 等項目中。

木蘭協議的主要產生背景在于之前發生的一些國際事件:

全球最大的開源軟件基金會 ASF(Apache 軟件基金會)的管理辦法中明確說明其遵循美國出口法律,所以它旗下的所有項目亦受到美國出口法律的管制。而 ASF 旗下開源項目的名單中有許多耳熟能詳的項目,比如 Kafka、Solr、Hadoop 與 Spark 等;

全球最大源碼托管平臺 GitHub表示:http://GitHub.com、GitHub Enterprise Server 以及您上傳到任一產品的信息可能受美國出口管制法律的約束,包括美國出口管理條例(EAR)。并且實際上其已經對古巴與朝鮮等地實施限制。

而國內的OceanBase和OpenGauss也都宣稱支持木蘭協議。

寫在最后

寫這一篇文章的目的, 其實源于一些私下的討論, 關于國產數據庫價格的問題, 到底國產數據庫怎么定價是最合理的。當然起因也是一方面用戶害怕過早下注,不敢壓重注投資;另外一方面也是新產品琳瑯滿目, 用戶無所適從。

但是從生態的角度來看, 如果大家都采取這樣的措施, 很有可能會導致數據庫生存空間不足, 畢竟國產數據庫的發展還是要靠我們自己, 喜歡的產品, 就支持他們一下吧。

本期的國產數據庫選型避坑系列之生態篇就閑扯到這里, 下次再見。

【相關資料】

[1] https://mp.weixin.qq.com/s/gwhWy37SSNEDVfJW0Aenmw

[2] https://db-engines.com/en/ranking

[3] http://GitHub.com

本期嘉賓

祁國輝

前Oracle云平臺事業部電信行業售前技術總監

網名"atiger",前 Oracle 云平臺事業部電信行業售前技術總監。擁有超過25年數據庫和數據倉庫HK經驗。曾創辦著名數據倉庫網站:www.dwway.com (數據倉庫之路)。